たいしたことはやってません。きっとプログラマの人から見れば酷いソースなんだろうと思います。
MyMiniCity部のURLを列挙したdata.datファイルを作り、ループでw3m -dumpに食わせてるだけです。
これをcronで1日2回巡回。どれだけ意味があるか分かりませんが、2,3日作動させてみます。
#!/usr/bin/perl $dat = "./data.dat"; # データファイル読み込み open(DAT,"$dat") || print "File Open Error"; @list = <DAT>; close(DAT); foreach $line(@list) { system "/usr/bin/w3m -dump $line"; sleep(3); } exit;
kawadashとゆかいな仲間たち » myminicityをみんなで育てるためのRubyスクリプト
とりあえずこっちを仕込む。上のやつは、直接MyMiniCity部のHTMLを取り込むように改造したい。
これの続き。今度は全部Perlでやってみました。MyMiniCity部のHTMLを取得して、MyMiniCityのURLを抽出して、GETしてます。ツッコミ募集。
#!/usr/bin/perl use LWP::UserAgent; use HTTP::Request; use HTTP::Response; use HTML::LinkExtor; # MyMiniCity CluB my $URL = 'http://twitter.g.hatena.ne.jp/keyword/MyMiniCity%E9%83%A8'; my $proxy = new LWP::UserAgent; my $req = HTTP::Request->new('GET' => $URL); my $res = $proxy->request($req); my $p = HTML::LinkExtor->new(unlink(),$URL); $p->parse($res->{_content}); for $link ($p->links){ my $href = join(" ", @{$link}); if ($href =~ /.*http:\/\/.*\.myminicity\.com/) { $href =~ s/a\shref\s//; my $proxy = new LWP::UserAgent; my $req = HTTP::Request->new('GET' => $href); my $res = $proxy->request($req); sleep(5); } } exit;
namaRyo2008/01/08 12:58w3m版、close(DAT);の間違えかと思われます。
smokeymonkey2008/01/08 13:05ホントだーお恥ずかしい。