목록크롤링 (2)
코드 한 줄
사용자 환경 : macOS Sierra 10.12.6, Python 3.6.4, PyCharm 2017.3.4 build PC-173.4674.37. 이 글을 읽기 전, 1편 포스팅을 숙지 하셔야 됩니다. 설치는 다 했으니 본격적으로 실행에 옮겨보자. 1. 우선 필요한 파이썬 라이브러리들을 임포트 한다. from bs4 import BeautifulSoup from selenium import webdriver 2. driver라는 이름의 변수에 webdriver 객체를 만들어 저장한다. from bs4 import BeautifulSoup from selenium import webdriver # 위치 지정 driver = webdriver.Chrome("(~저장경로)/chromedriver") 저장경..
사용자 환경 : macOS Sierra 10.12.6, Python 3.6.4, PyCharm 2017.3.4 build PC-173.4674.37. 먼저 웹 크롤링이란 웹 사이트에서 원하는 정보를 자동으로 수집하는 것을 의미한다. 본인은 크롤링을 위해 파이썬 라이브러리인 BeautifulSoup과 Selenium을 사용했다. 첫 번째로 BeautifulSoup을 설치해보자. https://www.crummy.com/software/BeautifulSoup/#Download 빨간줄을 클릭해 다운을 받고 압축을 해제한다. 본인은 맥을 사용하고 있으므로 터미널을 열어 설치를 마무리한다. 1. 압축을 해제한 폴더로 이동한다. $> cd (압축푼경로~)/beautifulsoup4-4.6.0/ 2. 설치한다. $..