메뉴
검색
클라우드포털

강좌

클라우드/리눅스에 관한 강좌입니다.

프로그램

파이썬기초141 : 웹크롤링예제- 네이버첫페이지

관리자 작성
작성일 2023.06.23 10:10

503 조회
0 추천
목록

글검색

최저가 서버호스팅 제공 : 85,000원/월

#-*- coding: utf-8 -*-

# naver new

import urllib

from bs4 import BeautifulSoup

from datetime import datetime

soup = BeautifulSoup(urllib.request.urlopen('http://www.naver.com').read(), 'html5lib')

editData = soup.find_all('a', {'class': "newssa"})

#print editData

editDataStr = str(editData)

editDataStr = editDataStr.replace('[','')

editDataStr = editDataStr.replace(']','')

editDataStr = editDataStr.replace('"','')

editDataStr = editDataStr.replace('<a class=",">','')

editDataStr = editDataStr.replace('src=http://img.naver.net/static/newsstand/up/2014/0715/','')

editDataStr = editDataStr.replace('target=_blank><img alt="," />','')

editDataStr = editDataStr.replace(', ','\n')

editDataStr = editDataStr.replace('href=','')

editDataStr = editDataStr.replace('.gif/>','')

editDataStr = editDataStr.replace('src=http://img.naver.net/static/newsstand/up/2015/0424/nsd163650137','')

editDataStr = editDataStr.replace('src=http://img.naver.net/static/newsstand/up/2015/0713/nsd145758454.png/>','')

editDataStr = editDataStr.replace('src=http://img.naver.net/static/newsstand/up/2015/0303/nsd152544150','')

editDataStr = editDataStr.replace('src=http://img.naver.net/static/newsstand/up/2015/0707/nsd105132418','')

editDataStr = editDataStr.replace('src=http://img.naver.net/static/newsstand/up/2014/0912/nsd144736648','')

print(editDataStr)

setLines = editDataStr.splitlines() #editDataStr 변수 안에 있는 데이터를 한 줄씩 분리해서 setLines에 저장

for line in setLines: #setLines를 한 줄씩 읽어서 line변수에 넣는다.

line = line[4:] #line의 앞에 4글자를 잘라낸다.

space = line.rfind(' ') #뒤에서부터 공백이 있는 문자열의 인덱스를 찾아 변수에 저장한다.

line = line[:space] #찾아낸 문자열 인덱스 뒤로 다 잘라낸다.

print(line)

"무단배포금지: 클라우드포털(www.linux.co.kr)의 모든 강좌는 저작권에 의해 보호되는 콘텐츠입니다. 무단으로 복제하여 배포하는 행위는 금지되어 있습니다."

이전

GNU C컴파일러 gcc로 C소스 컴파일하는 방법

작성일 2023.07.17 09:58
다음

파이썬기초140 : 웹크롤링예제-클리앙

작성일 2023.06.23 10:07

댓글 0

등록된 댓글이 없습니다.

로그인한 회원만 댓글 등록이 가능합니다.

공지사항

등록일 09.15

네이버클라우드 콘솔(console) 실무작업 강좌를 시작합니다.
등록일 09.13

네이버클라우드 자격증 NCE 요약강의를 시작하였습니다.
등록일 06.05

쉘프로그래밍(shell programming)강좌를 시작했습니다.
등록일 05.25

록키리눅스(RockyLinux) 강좌를 시작했습니다.
등록일 01.10

리눅스마스터 자격증 강좌를 업로드하고 있습니다.
등록일 01.10

클라우드와 리눅스 보안강좌 업로드 중입니다.
등록일 08.09

파이썬 강좌를 시작합니다.

뉴스광장

등록일 09:49

에이콘아카데미 강남, 자바(JAVA)중심 풀스택 캠프
등록일 09:48

더조은아카데미 종로, 빅데이터분석(with 파이썬)과 엘라스틱서치를 활용한 자바(Java)웹개발자양성
등록일 04.26

[HIWARE 보안솔루션] 클라우드 보안엔지니어 양성과정
등록일 04.26

[KT클라우드 NHN클라우드] 클라우드 엔지니어 취업과정
등록일 04.26

[취업과정8기] 5월 국비 웹 개발자 양성 무료교육 과정
등록일 04.26

(5/16 개강) 구디아카데미 83기 백엔드 개발자 부트캠프
등록일 04.26

[★고용노동부 5년인증 우수훈련기관] 전액국비지원 기업형 실무 인재 양성 자바웹개발자 과정!
등록일 04.25

에이콘아카데미 강남, 자바(JAVA)중심 풀스택 캠프
등록일 04.25

더조은아카데미 종로, 빅데이터분석(with 파이썬)과 엘라스틱서치를 활용한 자바(Java)웹개발자양성
등록일 04.25

[★고용노동부 8년 우수훈련기관] 부산 수강후기 1등 전액국비지원 IT 기업체 취업 과정

현재 회원수 : 60,035 명
현재 강좌수 : 35,793 개
현재 접속자 : 215 명