Python BeautifulSoup WEBスクレイピング

BeautifulSoupを使用したスクレイピングのサンプルです。


ページにアクセスして、h1タグを表示します。

from urllib.request import urlopen
from bs4 import BeautifulSoup

html = urlopen("http://www.sakutyuu.com/")
bsObj = BeautifulSoup(html.read())
print(bsObj.h1)

1

 

 

 

 

タグを検索し、テキストを取得する。

from urllib.request import urlopen
from bs4 import BeautifulSoup

html = urlopen("http://www.sakutyuu.com/")
bsObj = BeautifulSoup(html)
h1List = bsObj.findAll("h1")
for h1 in h1List:
    print(h1.get_text())

2

 

 

 

 

 


Bookmark this on Yahoo Bookmark
Bookmark this on Google Bookmarks
Share on LinkedIn
LINEで送る
Pocket

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

次のHTML タグと属性が使えます: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>