textとstring
2015.08.20 Thu
ついさっき投稿したこれBeautifulSoupとMechaizeでwebスクレイピングで最後抽出してきたhtmlの文章を加工整形する際、t.text.strip()しました。
抽出してきたhtmlはこんな感じ(見やすいように改行を加えている箇所があります)
これを最初print(t.string)していました。
すると
これが本当によくわからなくて、強い人に聞いてみたところ.textを使ってみてはどうかと言われました。これでようやく先の記事のように文字列だけを抽出出来ました。
textとstringの違いはよくわからないままですが、少なくともこの方法ではこれが最善手だと思いました。
Tweet
抽出してきたhtmlはこんな感じ(見やすいように改行を加えている箇所があります)
これを最初print(t.string)していました。
すると
現在あなたの受講している科目についての休講情報はありません。このようにいくつかがNoneになってしまいます。
None
None
None
現在あなたへの学生アンケート情報はありません。
現在受付期間中のファイル提出情報はありません。
これが本当によくわからなくて、強い人に聞いてみたところ.textを使ってみてはどうかと言われました。これでようやく先の記事のように文字列だけを抽出出来ました。
textとstringの違いはよくわからないままですが、少なくともこの方法ではこれが最善手だと思いました。
スポンサーサイト
カテゴリー:ぷよぐやみんぐ
Tweet