목록파이썬 (5)
코드 한 줄
사용자 환경 : macOS Sierra 10.12.6, Python 3.6.4, PyCharm 2017.3.4 build PC-173.4674.37. 이 글을 읽기 전, 1편 포스팅을 숙지 하셔야 됩니다. 설치는 다 했으니 본격적으로 실행에 옮겨보자. 1. 우선 필요한 파이썬 라이브러리들을 임포트 한다. from bs4 import BeautifulSoup from selenium import webdriver 2. driver라는 이름의 변수에 webdriver 객체를 만들어 저장한다. from bs4 import BeautifulSoup from selenium import webdriver # 위치 지정 driver = webdriver.Chrome("(~저장경로)/chromedriver") 저장경..
사용자 환경 : macOS Sierra 10.12.6, Python 3.6.4, PyCharm 2017.3.4 build PC-173.4674.37. 먼저 웹 크롤링이란 웹 사이트에서 원하는 정보를 자동으로 수집하는 것을 의미한다. 본인은 크롤링을 위해 파이썬 라이브러리인 BeautifulSoup과 Selenium을 사용했다. 첫 번째로 BeautifulSoup을 설치해보자. https://www.crummy.com/software/BeautifulSoup/#Download 빨간줄을 클릭해 다운을 받고 압축을 해제한다. 본인은 맥을 사용하고 있으므로 터미널을 열어 설치를 마무리한다. 1. 압축을 해제한 폴더로 이동한다. $> cd (압축푼경로~)/beautifulsoup4-4.6.0/ 2. 설치한다. $..
사용자 환경 : macOS Sierra 10.12.6, Python 3.6.4, PyCharm 2017.3.4 build PC-173.4674.37. 인덱싱에서는 문자열 중에서 어느 위치에 있는 문자를 뽑아낼 때 사용했다. 그렇다면 파이썬 문자열 인덱싱에 대해 다룬 게시글에서 사용했던 예제인 "Life is too short, You need Python"이라는 문자열에서 단순히 한 문자만을 뽑아내는 것이 아니라 "Life" 또는 "You" 같은 단어들을 뽑아내는 방법은 없을까? 다음과 같이 슬라이싱 기법을 이용하면 간단하게 처리할 수 있다. >>> a = "Life is too short, You need Python" >>> a[0:4] 'Life' 눈치가 빠른 사람들은 이미 알겠지만, a[0:4]가..
사용자 환경 : macOS Sierra 10.12.6, Python 3.6.4, PyCharm 2017.3.4 build PC-173.4674.37. 인덱싱(Indexing)이란 무엇인가를 '가리킨다'는 의미이다. >>> a = "Life is too short, You need Python" 위 소스 코드에서 변수 a에 저장한 문자열의 각 문자마다 번호를 매겨 보면 다음과 같다. L i f e i s t o o s h o r t , Y o u n e e d P y t h o n 0 1 2 3 0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1 2 3 이제 다음 예제를 실행해 보자. >>> a = "Life is too short, You n..
사용자 환경 : macOS Sierra 10.12.6, Python 3.6.4, PyCharm 2017.3.4 build PC-173.4674.37. 먼저 파이썬이 설치되어 있는지 터미널을 열어 확인해보자. $> python --version Python 2.7.10 그럼 위와 같이 Python 2.7.10이라는 문구가 나타날 것이다. (버전이 다를 수 있고, 설치가 안되어 있을 수도 있다) 앞으로 파이썬을 배우면서 3 버전대를 사용할 것이기 때문에 파이썬 3가 설치되어 있는지 다시 한 번 터미널에서 확인해보자. $> python3 --version -bash: python3: command not found 위와 같이 -bash: python3: command not found 이라고 나오면 설치가 안..