Документы в Яндексе – размеры

В http://company.yandex.ru/ написано:

В поиске Яндекса сегодня
сайтов: 2 533 866,
веб-страниц: 875 760 238,
объем проиндексированной
информации: 22 538 ГБ.

Когда-то я подбивал статистику по средним параметрам страниц в рунете, сравнивал ее с разными данными – вроде все отлично сходилось. По этой статистике получалось, что текста в html-документе в среднем 6 кБ, а вместе с кодом – 17 кБ. Вряд ли статстика принципиально изменилась…
Берем 17000, умножаем на 875760238 – получаем 13.54 ТБ.
Берем 6000, умножаем на 875760238 – получаем 4.78 ТБ.
***
А у Яндекса написано, что объем проиндексированной информации – 22.5 ТБ. Нестыковочка.
Я вот всегда считал, что проиндексированная информация – это типа тексты страницы. А весь скачанный код – не хранится.

Неужели проиндексированное по-Яндексовски – это скачанное?

PS И даже так, что если скачано 22.5 ТБ – то неужели средний размер страницы почти в 2 раза увеличился?

Ходил на Щегринку.

С пятницы по вчера ходил по реке Щегринка в составе группы из 7 человек. Спать хочу пока еще. 🙂

PS Да, кстати, почему я мало писАл в последнее время – писАл ссылочный аукцион. Написал, тестируется.