Artisan

Artisan
Рейтинг
377
Регистрация
04.03.2005
Пишу программы для вычислительных машин, от драйверов устройств, до сложных систем для работы с большим количеством знаний. Умею бережно использовать железо, и другие ресурсы.

По всем языкам надо делать разные сайты на разных доменах а если даже на домены денег нет то про дальнейшее продвижение можно забыть.

Как писал midian777
Я один ничерта не понял??? :)
Чего ждём?

Когда BBC молоко холодное давать начнет, ...

Как писал lagif
Artisan
За Вами очередь... :D

А я давно толком не фотографировался, ...

Как писал lagif
начальство требует,

Начальство надо учить и воспитывать, ...

Как писал lagif
Сильно ли словоформы результата влияют на релевантность?

Это очень зависит от подготовки Вашей целевой аудитории и умения использовать язык запросов системы.

http://www.repairfaq.org/filipg/LINK/F_crc_v3.html

http://www.repairfaq.org/filipg/LINK/F_crc_v31.html

The basic idea of CRC algorithms is simply to treat the message as an enormous binary number, to divide it by another fixed binary number, and to make the remainder from this division the checksum. Upon receipt of the message, the receiver can perform the same division and compare the remainder with the "checksum" (transmitted remainder).

"fixed binary number" о котором здесь написано и есть магическое число о котором я писал выше а у остатка от деления всегда есть перекос то есть он не равновероятен для случайных исходных данных, но еще раз повторяю что на самом деле все еще хуже и любой хэш алгоритм надо правильно применять и понимать где хэширование может дать результат далекий от ожидаемого.

Google при поиске в русском скорее всего определяет язык по кодировке страницы, что к домену или IP адресу не имеет никакого отношения, а на одном IP адресе может хоститься десятки тысяч сайтов с доменами из любых разных стран и при этом сам IP адрес может быть выделен организации которая находится в стране не имеющей никакого отношения к доменам сайтов которые хостятся на этом IP адресе.

А при чем здесь IP адреса вообще? Любой RU домен может хоститься не только в России а и где угодно то есть IP адрес у него как Россия не будет определяться.

Возьмите от FreeBSD например исходники утилиты whois а там запросы к whois серверам что скорее всего как раз то что надо.

Как писал Interitus
Объем данных конечно немеряный, так что если в лоб так делать не хватает ресурсов, то надо искать способы что-то выкинуть.

Можно хранить в хэш корзинах только малое число указателей на страницы а те корзины где их получится слишком много просто не учитывать потому что скорее всего они соответствуют фрагментам текстов которые часто встречаются на многих разных сайтах типа "добро пожаловать" и другим стандартным фразам.

Всего: 5936