Webページを自動更新するには次に記すmeta要素を使う.
<meta equiv="Refresh" content="1;URL=hogehoge">
http://www.htmq.com/html/meta.shtml
2007年12月30日日曜日
2007年12月21日金曜日
2007年11月23日金曜日
不正なURLやアクセス時にエラーが返されるURLへの対処
クローラには次のような機能が必要になるようです.
クローリングの最中に,不正なURLやアクセス時にエラーが返されるURLに遭遇した場合,それらを無視する.
http://blog.japan.cnet.com/inoue/archives/001201.html
クローリングの最中に,不正なURLやアクセス時にエラーが返されるURLに遭遇した場合,それらを無視する.
http://blog.japan.cnet.com/inoue/archives/001201.html
2007年11月19日月曜日
2007年11月10日土曜日
KOF2007
KOF2007に行ってきました.
Squeakの講演とOLPC(本当の名称は2文字だったけど,忘れてしまいました)の実物を見るのが目的です.
講演のほうは,OLPCプロジェクトのお話と,Squeak Etoysのデモでした.
プロジェクトやEtoysの思想にふれることができて大変良かったです.
Etoysを中学校の授業で利用したお話などもあったのですが,
中学生のプログラミング能力はなかなか侮り難いものがありました.
OLPCのほうは,思いのほか多機能なPCでぜひとも1台入手したいと思いました.
実際に触ったのですが,少なくともFirefoxはさくさくと動いてました.
OSはFedoraとのことです.
あと,最近(私が,世間もそうですけど)注目しているRubyの勉強会をしている団体の方とお話ししました.新人さんウエルカムということなので,行ってみようかなという気になりました.
Squeakの講演とOLPC(本当の名称は2文字だったけど,忘れてしまいました)の実物を見るのが目的です.
講演のほうは,OLPCプロジェクトのお話と,Squeak Etoysのデモでした.
プロジェクトやEtoysの思想にふれることができて大変良かったです.
Etoysを中学校の授業で利用したお話などもあったのですが,
中学生のプログラミング能力はなかなか侮り難いものがありました.
OLPCのほうは,思いのほか多機能なPCでぜひとも1台入手したいと思いました.
実際に触ったのですが,少なくともFirefoxはさくさくと動いてました.
OSはFedoraとのことです.
あと,最近(私が,世間もそうですけど)注目しているRubyの勉強会をしている団体の方とお話ししました.新人さんウエルカムということなので,行ってみようかなという気になりました.
2007年11月5日月曜日
ロボット規約
ロボット規約(この名前であっているかどうかは不明です)に準拠したクローラに対しては,次の二つの方法で管理下のWebページへの訪問の可否を指示できるそうです.
http://www.robotstxt.org/wc/robots.html
- Robots Exclusion Protocol
- Robots META tag
http://www.robotstxt.org/wc/robots.html
2007年10月28日日曜日
Squeakの用語
Squeak本を3章まで読みました.
この章までに登場した用語をまとめておきます.
オブジェクト:クラスとインスタンスの総称(今までインスタンスだけだと思ってました)
グローバルオブジェクト
リテラルオブジェクト
変数
偽変数: プログラムが値を代入できない変数.true,false,nil,self,super
クラス:インスタンスの共通する部分をまとめる仕組み
インスタンス
継承:クラスの共通する部分をまとめる仕組み
オーバライド
インスタンス変数
クラス変数
インスタンスメソッド
self: Javaではthis
この章までに登場した用語をまとめておきます.
オブジェクト:クラスとインスタンスの総称(今までインスタンスだけだと思ってました)
グローバルオブジェクト
リテラルオブジェクト
変数
偽変数: プログラムが値を代入できない変数.true,false,nil,self,super
クラス:インスタンスの共通する部分をまとめる仕組み
インスタンス
継承:クラスの共通する部分をまとめる仕組み
オーバライド
インスタンス変数
クラス変数
インスタンスメソッド
self: Javaではthis
2007年10月26日金曜日
プロキシ越えの方法
プロキシ越えの方法ですが,早速わかりました.
具体的にコードで書くと,以下のようになります.
[1] ど素人のためのど素人によるSquek入門
http://squeak.qp.land.to/wiki/
具体的にコードで書くと,以下のようになります.
proxyHost := 'hogehoge'.
proxyPort := 8080.
HTTPSocket useProxyServerNamed: proxyHost port: proxyPort.
url := 'http://www.google.co.jp'.
HTTPSccket httpGet: url.
[1] ど素人のためのど素人によるSquek入門
http://squeak.qp.land.to/wiki/
フィールドサーバからHTML文書を取得する
フィールドサーバからHTML文書を取得する方法は,以下のとおりです.
HTTPSocket httpGet: 'http://www.google.co.jp'.
ただ,プロキシサーバ経由でしかHTTP通信が許されていないネットワークの場合(いわゆる,プロキシ越えをしなければならない場合)では,当然のことながら,上記の方法では無理でした.
プロキシ越えの方法については今後調べていきたいと思います.
HTTPSocket httpGet: 'http://www.google.co.jp'.
ただ,プロキシサーバ経由でしかHTTP通信が許されていないネットワークの場合(いわゆる,プロキシ越えをしなければならない場合)では,当然のことながら,上記の方法では無理でした.
プロキシ越えの方法については今後調べていきたいと思います.
フィールドサーバモーフを作成するにあたって
フィールドサーバという機器で観測されたデータを表示するSqueakのモーフを作ろうとしています.
処理の手順はだいたい以下のとおりでしょうか.
これから実装するのに必要なAPIとかを調べていきたいと思います.
処理の手順はだいたい以下のとおりでしょうか.
- 観測データが記されたHTML文書をフィールドサーバから取得する.
- 取得したHTML文書を解析して,観測データを抽出する.
- 抽出した観測データを表示用のモーフ(フィールドサーバモーフという名前にします)に設定する.
これから実装するのに必要なAPIとかを調べていきたいと思います.
2007年10月25日木曜日
2007年10月9日火曜日
登録:
投稿 (Atom)