Skip to content

CHICPRO

  • Life Log
  • Cycling Log
  • Photo Log
    • Portrait
    • Landscape
    • Flower
    • Etc
  • Coding Log
  • Information

Tag: 파이썬

[Python] 아마존 상품검색 페이지의 스폰서 광고 상품 ASIN 수집하기

2017-03-31 by 편리

아마존 상품 검색 페이지 중 오른 쪽 스폰서 광고 상품의 ASIN 정보를 수집한다. # _*_ coding: utf-8 _*_ from bs4 import BeautifulSoup import urllib import html5lib import time import re keywords = ‘fishing rod’ headers = {‘User-Agent’: ‘ Mozilla/5.0 (X11; Ubuntu; Linux x86_64; rv:47.0) Gecko/20100101 Firefox/47.0’} asins = [] values = {‘keywords’: keywords, ‘page’ : …

Continue Reading

[Python] 아마존 상품 검색페이지에서 ASIN 정보 수집하기

2017-03-31 by 편리

아마존 사이트에서 fishing rod 라는 검색어로 상품을 검색했을 때 검색된 상품 리스트의 ASIN 정보를 수집하는 코드이다. # _*_ coding: utf-8 _*_ from bs4 import BeautifulSoup import urllib import html5lib import time def getSearchItemAsin(keywords): headers = {‘User-Agent’: ‘ Mozilla/5.0 (X11; Ubuntu; Linux x86_64; rv:47.0) Gecko/20100101 Firefox/47.0’} asins = [] sleep_time = 0 sleep_exec = True for …

Continue Reading

[Python] 파이썬3.6 팁 정리

2017-03-30 by 편리

Ubuntu 16.04 LTS 버전에 Python 3.6 버전을 설치한 상태를 기준으로 한다. pip 업그레이드 You are using pip version 8.1.1, however version 9.0.1 is available. You should consider upgrading via the ‘pip install –upgrade pip’ command. 위와 유사한 메세지가 표시되는 경우 내용대로 pip install –upgrade pip 실행해도 pip 업그레이드 되지 않는다면 아래 명령을 실행한다. $ python3.6 …

Continue Reading

[Python] 파일에서 필요한 데이터를 추출해 파일로 저장하기 #3

2017-03-13 by 편리

오늘은 파이썬의 mmap 모듈과 multiprocessing 모듈을 이용해서 텍스트 파일의 데이터를 추출해 재가공하는 부분을 작성해봤다. 대용량 파일의 처리는 mmap 모듈을 사용하는 것이 효율적이라고 해서 적용을 했는데.. 일단 10만건 기준으로 기존보다는 10초정도 빨라진다. 추출 데이터를 좀 더 늘려서 테스트를 진행해봐야 할 것 같다. # _*_ coding: utf-8 _*_ from multiprocessing import Process import mmap import time import …

Continue Reading

[Python] 파일에서 필요한 데이터를 추출해 파일로 저장하기 #2

2017-03-10 by 편리

이전에 작성했던 코드를 다시 한번 수정했다. 별다른 것은 없고 퍼포먼스 체크를 위해 실행 시간을 출력하는 부분을 상점ID별로 정보를 출력하도록 수정했다. # _*_ coding: utf-8 _*_ from multiprocessing import Process import time import datetime import locale seller = [] exclude = [] datas = [] def get_exce_time(start, end): return datetime.timedelta(seconds=(end – start)) def number_format(num, places=0): “””Format …

Continue Reading

Posts pagination

  • 1
  • 2
  • Next

Recent Posts

  • SK 세븐모바일 유심 셀프교체
  • php 배열 연산에서 + 와 array_merge 의 차이
  • pcntl_fork 를 이용한 다중 프로세스 실행
  • 아이폰 단축어를 이용하여 주중 공휴일엔 알람 울리지 않게 하기
  • 구글 캘린더 전체일정 재동기화
  • OpenLiteSpeed 웹서버에 HTTP 인증 적용
  • OpenLiteSpeed 웹어드민 도메인 연결
  • WireGuard를 이용한 VPN 환경 구축
  • Ubuntu 22.04 서버에 OpenLiteSpeed 웹서버 세팅
  • 맥 vim 세팅

Recent Comments

  • 편리 on 업무관리용 그누보드 게시판 스킨
  • 임종섭 on 업무관리용 그누보드 게시판 스킨
  • 캐논 5D 펌웨어 | Dslr 펌웨어 업그레이드 방법 82 개의 베스트 답변 on 캐논 EOS 30D 펌웨어 Ver 1.0.6 , EOS 5D 펌웨어 Ver 1.1.1
  • Top 5 캐논 5D 펌웨어 Top 89 Best Answers on 캐논 EOS 30D 펌웨어 Ver 1.0.6 , EOS 5D 펌웨어 Ver 1.1.1
  • 편리 on 워드프레스 애니메이션 gif 파일을 mp4로 변환하여 출력하기
  • 임팀장 on 워드프레스 애니메이션 gif 파일을 mp4로 변환하여 출력하기
  • 편리 on Notepad++ NppFTP 플러그인 수동 설치
  • paul-j on Notepad++ NppFTP 플러그인 수동 설치
  • YS on Windows 10 iCloud 사진 저장 폴더 변경
  • 편리 on Docker를 이용한 Centos7 + httpd + php 5.4 개발환경 구축

Meta

  • Log in
  • Entries feed
  • Comments feed
  • WordPress.org
© 2025 CHICPRO | Built using WordPress and SuperbThemes