2007年2月7日 星期三

Google 連結分析 @ 苦牢之最後一年

Google 連結分析 @ 苦牢之最後一年

到底有哪些人寫了和你有關的文章呢 ?

今天看到一篇文章,提到 GoogleWebmaster Tools 又多了新功能,可以檢查站台的 backlink 了。

在過去的年代裡,你寫了一篇文章 (或一個網頁),如果想要知道別人是從什麼地方連過來看的話,最簡單的方法應該就是在 server 端加個小 script,記錄每次 access 的 referer;後來,在 search engine 越來越強大以後,就可以利用 search engine 來查 (假定對方沒有開 noindex 之類),例如 Google 有提供 link: operator,只要在你要查的 URL 前面加個 link: 就可以看到有什麼網頁有連結過來了。

不過如果你想要檢查整個網站的 backlink 的話,這顯然不是個好主意,自己手動查太累,寫 bot 去查可能會被 ban 掉,怎麼辦呢 ? 這時候 Google 的這個新玩意兒就可以派上用場啦。進到 Webmaster Tools 以後,可以看到上面多了一個 tab 叫做 Links 的,裡面有 External links (外部連結)Internal links (內部連結),分別可以看出每個 URL 各被連結了幾次、從什麼地方過來的連結,而且還可以整張 table 抓回家做進一步分析。

這功能雖然很不錯,但是我覺得有兩點可以改進的空間;第一就是應該要有一個可以排序的功能,通常我會想要知道比較熱門文章的來源,但是在網頁上看到的順序似乎沒什麼規則可言。這個問題倒是還蠻好解決的,只要把 CSV 檔抓下來,然後可以用 sort -t, -k 2 -r -n 這個指令來幫助排序;該 CSV 檔只有 URL 和連結次數的關係,把你有興趣的 URL 丟進網頁上面有一個 Find a page 的功能,就可以幫你進一步找出從哪連過來的。

第二個可以改進的地方就是… 舉個例子來說好了,blog 站台的 sidebar 通常會放例如說 recent comment 或是 recent trackback 之類的,如果說好巧不巧的你送了一個 trackback 到某 blog 去,然後該 blog 平常被別人 trackback 的機率不高,你的 URL 就會一直掛在它的 sidebar 上,然後 search engine 的 bot 去抓的話就會發現該 blog 每一頁都有連到你這邊的 link XD 這問題我一時之間也找不到什麼比較快的解決辦法…

2007/02/07 Update : 剛剛有一篇報告說其實沒有 verify 過的網站也能看 backlink …

沒有留言: