반응형

사용자 환경 : macOS Sierra 10.12.6Python 3.6.4PyCharm 2017.3.4 build PC-173.4674.37.






이 글을 읽기 전, 1편 포스팅을 숙지 하셔야 됩니다.





설치는 다 했으니 본격적으로 실행에 옮겨보자.





1. 우선 필요한 파이썬 라이브러리들을 임포트 한다.

from bs4 import BeautifulSoup
from selenium import webdriver




2. driver라는 이름의 변수에 webdriver 객체를 만들어 저장한다.

from bs4 import BeautifulSoup
from selenium import webdriver

# 위치 지정
driver = webdriver.Chrome("(~저장경로)/chromedriver")

저장경로 살피세요




3. Selenium은 기본적으로 웹 자원들이 모두 로드될 때까지 기다려주지만, 암묵적으로 기다리는 시간을 조정할 수 있다.

from bs4 import BeautifulSoup
from selenium import webdriver

# 위치 지정
driver = webdriver.Chrome("(~저장경로)/chromedriver")

# 웹 자원 로드를 위해 암묵적으로 딜레이
delay_time = 3
driver.implicitly_wait(delay_time)




4. 이제 URL을 지정하여 접근하자.

from bs4 import BeautifulSoup
from selenium import webdriver

# 위치 지정
driver = webdriver.Chrome("(~저장경로)/chromedriver")

# 웹 자원 로드를 위해 암묵적으로 딜레이
delay_time = 3
driver.implicitly_wait(delay_time)

# URL 접근
driver.get('https://nid.naver.com/nidlogin.login')




5. 네이버 로그인 화면에서 아이디와 패스워드의 값을 넘기는 폼의 name 값이 각각 id, pw인 것을 확인할 수 있다.





6. webdriver의 find_element_by_name() 함수를 통해 태그를 지정하여 값을 넣어주자.

from bs4 import BeautifulSoup
from selenium import webdriver

# 위치 지정
driver = webdriver.Chrome("(~저장경로)/chromedriver")

# 웹 자원 로드를 위해 암묵적으로 딜레이
delay_time = 3
driver.implicitly_wait(delay_time)

# URL 접근
driver.get('https://nid.naver.com/nidlogin.login')

# ID, PW 입력
id = "본인_네이버_아이디"
pw = "본인_네이버_패스워드"
driver.find_element_by_name('id').send_keys(id)
driver.find_element_by_name('pw').send_keys(pw)




7. 이제 로그인 버튼을 눌러 로그인이 정상적으로 실행되는지 확인한다.

from bs4 import BeautifulSoup
from selenium import webdriver

# 위치 지정
driver = webdriver.Chrome("(~저장경로)/chromedriver")

# 웹 자원 로드를 위해 암묵적으로 딜레이
delay_time = 3
driver.implicitly_wait(delay_time)

# URL 접근
driver.get('https://nid.naver.com/nidlogin.login')

# ID, PW 입력
id = "본인_네이버_아이디"
pw = "본인_네이버_패스워드"
driver.find_element_by_name('id').send_keys(id)
driver.find_element_by_name('pw').send_keys(pw)

# 로그인 버튼 클릭
driver.find_element_by_xpath('//*[@id="frmNIDLogin"]/fieldset/input').click()




8. 로그인 후 실시간 검색어 추출을 위해 네이버 메인으로 이동한다.

driver.get("https://www.naver.com")




9. BeautifulSoup 객체를 이용해 페이지를 분석한다.

driver.get("https://www.naver.com")

html = driver.page_source
soup = BeautifulSoup(html, 'html.parser')




10. 5번에서와 같이 개발자 도구를 통해 실시간 검색어가 어느 태그에 있는지 확인한다.




11. 마지막으로 추출된 값들을 프린트 한다.

driver.get("https://www.naver.com")

html = driver.page_source
soup = BeautifulSoup(html, 'html.parser')

realtime_search_word = soup.select('div.ah_roll_area > ul.ah_l > li > a > span.ah_k')
for list in realtime_search_word:
    print(list.text.strip())






이로써 파이썬과 BeautifulSoup, Selenium, ChromeDriver 등과 같은 라이브러리를 사용하여 네이버에 로그인 후, 실시간 검색어를 추출하는 프로그램을 작성해보았다.












반응형
반응형

사용자 환경 : macOS Sierra 10.12.6Python 3.6.4PyCharm 2017.3.4 build PC-173.4674.37.






먼저 웹 크롤링이란 웹 사이트에서 원하는 정보를 자동으로 수집하는 것을 의미한다.



본인은 크롤링을 위해 파이썬 라이브러리인 BeautifulSoupSelenium을 사용했다.



첫 번째로 BeautifulSoup을 설치해보자.



https://www.crummy.com/software/BeautifulSoup/#Download




빨간줄을 클릭해 다운을 받고 압축을 해제한다.



본인은 맥을 사용하고 있으므로 터미널을 열어 설치를 마무리한다.




1. 압축을 해제한 폴더로 이동한다.

$> cd (압축푼경로~)/beautifulsoup4-4.6.0/



2. 설치한다.

$> python3 setup.py install

본인은 파이썬 2와 3 버전 모두 설치되어 있으므로 python3라는 키워드를 사용했다.




두 번째로는 Selenium을 설치해보자.



먼저 Selenium은 주로 웹 앱을 테스트하는데 이용하는 프레임워크이다. webdriver라는 API를 통해 운영체제에 설치된 Chrome을 제어한다.




1. 터미널을 이용한 Selenium 설치

$> pip install selenium



2. 크롬이 설치되어 있다는 가정하에 ChromeDriver를 다운 및 설치



https://sites.google.com/a/chromium.org/chromedriver/downloads



본인의 OS에 맞게 다운받자.



다운을 받고 압축을 해제하면 chromedriver라는 파일이 생긴다.



이 파일을 본인이 원하는 디렉터리에 보관한다. 이때 이 디렉터리 경로는 Selenium 객체를 생성할 때 필요하기 때문에 아무 곳에 두지 말자.





이번 포스트에서는 BeautifulSoup, Selenium, ChromeDriver를 설치하는 부분만 살펴봤다.



다음 글에서 직접 다뤄보는 부분을 살펴보자!

반응형
반응형

* 본 문제와 풀이의 저작권은 매일프로그래밍에 있습니다.






링크드 리스트(linked list)의 머리 노드(head node)와 정수 N이 주어지면, 끝에서 N번째 노드(node)를 제거하고 머리 노드(head node)를 리턴하라.


단, 리스트를 한번만 돌면서 풀어야 한다. N은 리스트 길이보다 크지 않다.




예제 } 


Input : 1 -> 2 -> 3 -> 4 -> 5, N = 2

Output : 1 -> 2 -> 3 -> 5

Input : 1 -> 2 -> 3, N = 3

Output : 2 -> 3

Input : 1, N = 1

Output : null











반응형
반응형

* 본 문제와 풀이의 저작권은 매일프로그래밍에 있습니다.






문자열 배열(string array)이 주어지면, 제일 긴 공통된 접두사(prefix)의 길이를 찾아라





예제 } 


Input : ["apple", "apps", "ape"]


Output : 2 // "ap"


Input : ["hawaii", "happy"]


Output : 2 // "ha"


Input : ["dog", "dogs", "doge"]


Output : 3 // "dog"











반응형
반응형

* 본 문제와 풀이의 저작권은 매일프로그래밍에 있습니다.






정수 배열(int array)과 정수 N이 주어지면, N번째로 큰 배열의 원소를 찾아라.





예제 }



Input : [-1, 3, -1, 5, 4], 2


Output : 4


Input : [2, 4, -2, -3, 8], 1


Output : 8


Input : [-5, -3, 1], 3


Output : -5











반응형
반응형

사용자 환경 : IntelliJ IDEA 2017.3.2 (Community Edition)

Build #IC-173.4127.27, built on December 26, 2017

JRE: 1.8.0_152-release-1024-b8 x86_64

JVM: OpenJDK 64-Bit Server VM by JetBrains s.r.o

Mac OS X 10.12.6





콜라츠 추측이란?



어떤 수 n에 대하여 n이 홀수일 경우, 3을 곱하고 1을 더한다.



n이 짝수일 경우, 2로 나눈다.



n이 1이 될 때까지 반복하며 그 과정을 출력하는 프로그램을 만들어보자.











반응형
반응형

* 본 문제와 풀이의 저작권은 매일프로그래밍에 있습니다.






정수로된 배열이 주어지면, 각 원소가 자기 자신을 제외한 나머지 원소들의 곱셈이 되게하라.



단, 나누기 사용 금지, 시간 복잡도 0(n)





예제 }



Input : [1, 2, 3, 4, 5]


Output : [120, 60, 40, 30, 24]





반응형
반응형

사용자 환경 : IntelliJ IDEA 2017.3.2 (Community Edition)

Build #IC-173.4127.27, built on December 26, 2017

JRE: 1.8.0_152-release-1024-b8 x86_64

JVM: OpenJDK 64-Bit Server VM by JetBrains s.r.o

Mac OS X 10.12.6





동전 거스름돈 알고리즘이란?



만약 1300원의 거스름돈을 손님에게 건네줘야 한다면 어느 조합으로 건네줘야 가장 적은 수의 동전을 건네주는가를 구하는 문제이다.



1300원의 경우, 500원짜리 2개, 100원짜리 3개로 총 5개가 가장 적은 수를 건네는 조합이다.











반응형
반응형

* 본 문제와 풀이의 저작권은 매일프로그래밍에 있습니다.






길이가 같은 두 문자열 A와 B가 주어지면, 서로 1:1 암호화가 가능한지 찾아라.



예제 }



Input : "EGG", "FOO"


Output : True        // E->F, G->O


Input : "ABBCD", "APPLE"


Output : True        // B->P, C->L, D->E


Input : "AAB", "FOO"


Output : False












반응형
반응형

사용자 환경 : IntelliJ IDEA 2017.3.2 (Community Edition)

Build #IC-173.4127.27, built on December 26, 2017

JRE: 1.8.0_152-release-1024-b8 x86_64

JVM: OpenJDK 64-Bit Server VM by JetBrains s.r.o

Mac OS X 10.12.6





먼저 유클리드 호제법이란?



두 정수의 최대 공약수를 구하는 방법 중 하나이며 최대 공약수를 구하는 방법은 다음과 같다.



  1.  매개변수로 a와 b를 받는다.
  2. b가 0이라면, a가 최대 공약수이다.
  3. b가 0이 아니라면, 매개변수로 b와 a%b를 받는다.
  4. 반복한다.







반응형

'Develop - > Java' 카테고리의 다른 글

[Algorithm] 자바 콜라츠 추측 구하기  (0) 2018.04.13
[Algorithm] 동전 거스름돈 알고리즘  (0) 2018.04.05

+ Recent posts