2008年5月25日 星期日

Google 的蜘蛛程式能夠填寫網頁上的 form

Google 的蜘蛛程式能夠填寫網頁上的 form

Google 在上星期宣佈說它的蜘蛛程式已經開始能夠自動填寫網頁上的表單 (form),進而去抓下結果頁的內容。這一類的內容在以往並不會被任何大型搜尋引擎收錄到,因為沒有一個直接的連接讓蜘蛛程式可以去爬。這也代表 Google 的搜尋索引現在包含了更多的內容。

照老貓觀察,不是所有的表單 Google 都能夠填寫。有結果網頁被收錄的情況,都是 form 裡原本就有設定好的值 (例如日期)。所以 drop down box (下拉式選擇)、radio button (單選按鈕)、及 check box (複選按鈕) 之類的 form 都可能被 Google 的蜘蛛程式自動填寫。而 text 或 text area 這一類的表單似乎沒有被爬。這也是有道理的: Google 再厲害,也不可能再完全沒有其他資訊的情況下猜出什麼樣的輸入值才是有意義的。

沒有留言: