강좌
클라우드/리눅스에 관한 강좌입니다.
프로그램 분류

파이썬기초111 :웹크롤링을 위한 selenium

작성자 정보

  • 관리자 작성
  • 작성일

컨텐츠 정보

본문

셀리니엄 설치 

pip install selenium 으로 설치한다. 


뷰티풀스프 설치 

pip install bs4 


셀리니엄은 webdriver라는 것을 통해 디바이스에 설치된 브라우저를 핸들링한다. 

크롬 드라이버 

https://sites.google.com/a/chromium.org/chromedriver/downloads

운영체제별로 나와 있는 것을 받는다. Chromedriver_win32.zip을 받아서 압축을 풀면 된다. 

실행파일을 c:\work로 복사한다. 


PhamtomJS webdriver는 웹테스팅을 위한 나온 headless browser이다. 

http://phantomjs.org/download.html

위의 주소에서 받을 수 있다. 압축파일을 받아서 실행파일만(\bin폴더) 복사한다. 

코드는 아래와 같다. 네이버 페이로 결제한 리스트가 있으면 그 문자열을 받아오는 코드이다. 

from selenium import webdriver

driver = webdriver.Chrome('c:\\work\\chromedriver')

driver.implicitly_wait(3)

driver.get('https://google.com')

driver.get('https://nid.naver.com/nidlogin.login')

driver.find_element_by_name('id').send_keys('naver_id')

driver.find_element_by_name('id').send_keys('naver_id')

driver.find_element_by_name('id').send_keys('my id')

driver.find_element_by_name('pw').send_keys('my pwd')

driver.get('https://order.pay.naver.com/home')

html = driver.page_source

from bs4 import BeautifulSoup

soup = BeautifulSoup(html, 'html.parser')

notices = soup.select('div.p_inr > div.p_info > a > span')


for n in notices:

    print(n.text.strip())

    

관련자료

댓글 0
등록된 댓글이 없습니다.

공지사항


뉴스광장


  • 현재 회원수 :  60,035 명
  • 현재 강좌수 :  35,791 개
  • 현재 접속자 :  153 명