pagetaka

写真、PC、ネット、岡山、旅の話題をお届けします

2015-07-09から1日間の記事一覧

PHP:URLのワナ。重複に引っかからない仕掛け

PHPでDOM、WEBスクレイピングを使いサイトの新規記事情報を得ようともがいております。 重複URLのはずがチェックを通り抜ける 「新記事」を得ようとすると、これまでどんな記事を取得したかという記録との照合が必要になります。 爺は、URLを…

PHP:サーバー接続時間30秒制限と折り合いをつける

PHPでDOM、WEBスクレイピング実現しようと、浅学菲才ならぬ「浅学被災」な状態になっている爺です。レンタルサーバーで連続使用30秒、というのを何とかしようと考えると熱が出そうです。熱が出ても解決できるならともかく、とてもできそうもないという…

PHP:Maximum execution time of 30 seconds exceeded

1(Aサイト) 11:43:39 : DB接続・サイト基本データ取得開始 11:43:39 : DB切断・サイト基本データ取得終了 11:43:39 : サイト表頁 個別記事リンク用DOM開始 11:43:40サイト代表頁で個別記事リンク取得--終了: 11:43:40 : サイト表頁 個別記事リンク…

PHP:htmlのtitle表示は大切

PHPをつかってDOM、WEBスクレイピングしようという、還暦が過ぎた爺のもがきであります。 HTMLの基礎問題にぶちあたる。titleの表示は大切でそのページに適切な内容を まずは、画像でございまする。 HTMLファイルのヘッダブにある「title」のうち、困…

散歩:歩きながらも考えるのはPHPのこと…

今朝の散歩は約7,000歩。昨夕は約10,000歩。作朝は歩数計代わりのNexus6を携行せず不明なれど、約6,000歩と妄想。 忙しかった昨日 昨日は、早朝ドライブ→散歩→町内会資源ごみ立ち番→朝食→PC:PHP→昼飯→TV:ホジュン→TV:火の神→PC:PHP(正規表現+文字列…