2026年2月3日,Google對其爬蟲文件進行了重大重組, Spotibo SEO將原本放在 Search Central 的爬蟲資訊拆分為兩層架構。 Search Engine Journal第一層是 Googlebot 專頁(適用於 Google Search),明確載明:
「When crawling for Google Search, Googlebot crawls the first 2MB of a supported file type, and the first 64MB of a PDF file... The file size limit is applied on the uncompressed data.」Search Engine RoundtableGoogle
第二層是通用爬蟲概覽頁面,說明 Google 所有爬蟲與擷取器的預設上限為 15MB。 Search Engine Journal +2值得注意的是,Google在短短9天內對文件進行了三次修訂。 SEO-Kreativ2月11日的第三版將措辭從確定性的「2MB」軟化為「a Google crawler like Googlebot may have a smaller size limit (for example, 2MB)」——「 Googlefor example」這個用詞讓2MB更像是參考值而非絕對硬限制,儘管實際測試確認截斷確實發生在2MB處。 SEO-Kreativ +2
2022年6月以前,Google從未公開記錄任何爬取大小限制。 Nitropack2021年John Mueller甚至在社群媒體上表示「we don't have a documented limit」(我們沒有記錄的限制)。** Search Engine Roundtable2022年6月28日**,Google首次公開發表部落格文章〈Googlebot and the 15 MB thing〉,記錄了15MB的限制,但當時Mueller就已確認「這個限制不是新的」。 Search Engine Journal
2MB限制的浮出水面源於 Google Search Central 幫助社群中的一個討論串。 DebugBear使用者 Mark van Ments 發現其網站內容被截斷, DebugBearGoogle Search Central 鑽石級產品專家 Dave Smart 與Google團隊確認後, DebugBear一位Google代表回覆:「I've heard back from the team, and indeed it looks like documentation was wrong, and that Googlebot only looks at the first 2 MB of raw html. Documentation is being updated.」DebugBear 這段話暗示15MB的文件說明其實是不精確的,Googlebot for Search 的實際行為一直就是2MB。
值得一提的是,2024至2025年間的Google核心演算法更新(2024年3月、8月、11月核心更新)均與爬取大小限制無關。2026年2月5日的 Discover Core Update 雖然時間相近,但也是完全不同的議題。 Google
SEO社群的反應與共識
SEO社群對此議題迅速形成了兩個陣營。務實派佔據主流,包括 John Mueller 本人、Dave Smart、Search Engine Journal 的 Roger Montti 等人,一致認為這對絕大多數網站不構成實際問題。Mueller 直白地說:「nobody's going to read 1,000 pages of text (equivalent of 2MB) in search of something that's on page 1,001. If you want to publish a novel, make it a PDF.」(沒有人會讀1,000頁的文字去找第1,001頁的東西。想發表小說的話,用PDF。) Search Engine Roundtable
SEO社群的反應與共識
SEO社群對此議題迅速形成了兩個陣營。務實派佔據主流,包括 John Mueller 本人、Dave Smart、Search Engine Journal 的 Roger Montti 等人,一致認為這對絕大多數網站不構成實際問題。Mueller 直白地說:「nobody's going to read 1,000 pages of text (equivalent of 2MB) in search of something that's on page 1,001. If you want to publish a novel, make it a PDF.」(沒有人會讀1,000頁的文字去找第1,001頁的東西。想發表小說的話,用PDF。) Search Engine Roundtable
SEO工具公司 Seobility 分析了4,450萬個頁面,發現僅 0.82% 超過2MB。 SeobilityHTTP Archive 的資料顯示,行動端HTML中位數約 22-33KB,第90百分位也僅 151KB。 Search Engine Roundtable +22MB大約等於200萬個字元,相當於將一本400頁小說塞進單一網頁。 Nikki Pilkington +2
Spotibo 進行了最具價值的實證測試,建立了3MB和16MB的測試頁面並提交Google索引。 Spotibo SEO結果發現3MB頁面的原始碼在約第15,210行被截斷(「Prevention is b」之後直接接上