クローラには次のような機能が必要になるようです.
クローリングの最中に,不正なURLやアクセス時にエラーが返されるURLに遭遇した場合,それらを無視する.
http://blog.japan.cnet.com/inoue/archives/001201.html
2007年11月23日金曜日
2007年11月19日月曜日
2007年11月10日土曜日
KOF2007
KOF2007に行ってきました.
Squeakの講演とOLPC(本当の名称は2文字だったけど,忘れてしまいました)の実物を見るのが目的です.
講演のほうは,OLPCプロジェクトのお話と,Squeak Etoysのデモでした.
プロジェクトやEtoysの思想にふれることができて大変良かったです.
Etoysを中学校の授業で利用したお話などもあったのですが,
中学生のプログラミング能力はなかなか侮り難いものがありました.
OLPCのほうは,思いのほか多機能なPCでぜひとも1台入手したいと思いました.
実際に触ったのですが,少なくともFirefoxはさくさくと動いてました.
OSはFedoraとのことです.
あと,最近(私が,世間もそうですけど)注目しているRubyの勉強会をしている団体の方とお話ししました.新人さんウエルカムということなので,行ってみようかなという気になりました.
Squeakの講演とOLPC(本当の名称は2文字だったけど,忘れてしまいました)の実物を見るのが目的です.
講演のほうは,OLPCプロジェクトのお話と,Squeak Etoysのデモでした.
プロジェクトやEtoysの思想にふれることができて大変良かったです.
Etoysを中学校の授業で利用したお話などもあったのですが,
中学生のプログラミング能力はなかなか侮り難いものがありました.
OLPCのほうは,思いのほか多機能なPCでぜひとも1台入手したいと思いました.
実際に触ったのですが,少なくともFirefoxはさくさくと動いてました.
OSはFedoraとのことです.
あと,最近(私が,世間もそうですけど)注目しているRubyの勉強会をしている団体の方とお話ししました.新人さんウエルカムということなので,行ってみようかなという気になりました.
2007年11月5日月曜日
ロボット規約
ロボット規約(この名前であっているかどうかは不明です)に準拠したクローラに対しては,次の二つの方法で管理下のWebページへの訪問の可否を指示できるそうです.
http://www.robotstxt.org/wc/robots.html
- Robots Exclusion Protocol
- Robots META tag
http://www.robotstxt.org/wc/robots.html
登録:
投稿 (Atom)