pagetaka

写真、PC、ネット、岡山、旅の話題をお届けします

WordVBA:twitterの数字を取りだす作業に没頭…

昨日の報告です。え? だれも報告を頼んでいない…。ええ、備忘録for耄碌爺 というようなことでお許しを。

twitterを閲覧し、「ソース」表示したらいろんな情報が寝ている(≒表示画面にはないがソースにはある)ことがわかり、なんとか取得したいともがいております。

昨日より前に、ソースをウェブブラウザ経由とせず、URLからマイクロソフトXML処理の流れで取得できることが確認できました。


取得した文字情報(≒HTMLタグやテキストなど)から、必要な数字を適切かつ自動(by VBA)で取りだせるかどうかという課題にとりくんでいました。正規表現などを駆使すれば、メモリ内(≒変数内)でも処理できるのでしょうが、TAKAにはちょっと高い壁です。それで、Word文書に貼り付け、余分な文字情報を削除し、結果、数字だけWord文書に残し、必要な数字を配列に取りこむ、というような横着を考えました。ところが、対象twitterURLにより、文字情報(≒HTMLタグやテキストなど)をWordに貼りつけた段階で「改行」コードの位置が微妙に異なるため、Word文書上の同じ段落位置に同じ意味(≒例えば、フォロー数)の数字が並ばないという現象が発生…。

はたまた、循環処理の上限数設定ミスでエラーが起こり、原因がそれだとわかるまでかなりの時間を要するという、耄碌爺全開状態の昨日でありました。

本日は、不要な「改行」コードを削除し、「段落」単位の処理をとりやめ、あわせて、検索文字列を「Range」として処理するという横着から、結果的に数字だけのWord文書で、同じ段落位置に同じ意味の数字が並ぶ状態を実現したいと妄想しているのでした…。