Новый нейротопик

T
На сайте с 15.11.2011
Offline
120
#141
mat1441:
Tecak, Теплое с мягким. Причем здесь новый домен. Речь о том, что гугл хранит все состояния всех доменов. Новый это другая тема. И да гугл хранит. Что и в каком виде и как это ранжирует - другой вопрос

А тебе не кажется, что ты сначала пишешь одно а потом другое?

Ты сказал про сайт. Я тебе сказал что при переносе забаненого сайта на другой домен, он опять проиндексируется.

Сайт. Домен. Чувствуешь разницу?

У тебя как-то странно связан в мозгу домен с контентом...

Дешевые VDS - Дешевле некуда! (http://0ll0.ru/4Ta9y)
M1
На сайте с 15.11.2007
Offline
127
#142

Tecak, Все ты прав про домены и сайты (кстати, слово "сайты" я до этого не упоминал). Я с тобой согласен

Ты не прав здесь:

Tecak:
если бы гугл хранил все сайты, которые когда-либо сканил его бот, он бы просто охренел...

А про практическую точку зрения спорить не буду

A
На сайте с 13.08.2015
Offline
63
#143
J-ran:
Сравнить с последней сохранённой копией из кэша, не?

Логично. Но кэш - это как бы "законсервированные данные", и Гугл их держит в уме.

J-ran:
Сомнительная заповедь. Для добротных коммерческих сайтов с вылизанными посадочными страницами она вообще не применима. Там просто нечего обновлять и незачем.

Почему же? Изменение цен, наличие/отсутствие товара, скидки могут появляться, комментарии. Даже банальная накрутка соц факторов (лайков,share и т.д). Если быть буквоедом, то это тоже "обовления сайта".

M
На сайте с 18.10.2006
Offline
185
#144

Гугл ничего не забывает. Имхо :).

И по дору - нет смысла хранить все 100500+ одинаковых страниц дора. Ибо достаточно положить в копилку "слепок" шаблона и десяток тысяч страниц для контроля. Естественно в онлайне подтягивать эти данные сразу же несколько проблемно. Потому вполне мб, что выкинутый из выдачи сайт зайдёт туда под другим доменом. Но при подробной проверке - его выкинут. Скорее всего за то же самое, за что выкинули прошлый раз. Но могут и сравнить со "слепком" - это быстрее.

Чаще всего выкинутые сайты банятся ещё быстрее потом.

Ну и повод для накопления - чем больше база - тем удобнее обучать алгоритмы. Потому выкидывать уже проиндексированное и проанализированное - смысла нет, даже если это дор и ему выписан бан :). Ведь основная работа уже проведена и боты отработали - осталось просто архивировать и сохранять, пользуя по надобности.

Кому-то - асерет-а-диброт, а кому-то - хатуль мадан. Вам выбирать!
vooo
На сайте с 25.08.2011
Offline
83
#145

прочитав 16 страниц полезнейшего контента, я понял, что сейчас все бабки в капчах! надо админиам писать, что бы отдельный раздел создавали про капчестроение!

_Snake_
На сайте с 06.12.2010
Offline
151
#146
MO $$$:
Но могут и сравнить со "слепком" - это быстрее.

Допустим у тебя есть какие-то лекала по которым ты приходишь к какому-то умозаключению(например в качестве лекала на этапе обучения может выступать какая-то статья). В следующий раз когда ты будешь использовать эту мысль, эти самые лекала уже тебе не нужны, т.к. твоя мысль, можно сказать, уже "вычислена", ты обучился. Тебе на надо каждый раз тужиться "вычислять" её заново. Так же на основе уже имеющихся знаний и новой информации ты можешь сделать новые умозаключения, они действуют аддитивно.

Поисковая машина действует так же. По началу может её обучал человек, указывая какая страница спам какая не спам. Дальше в процессе работы она уже сама обучается в боевых условиях. Чем больше дорвеев она банит, тем больше она обучается. Возможно даже сами создатели уже не понимают по каким признакам она вычисляет спам. Так, что ни какие слепки ей не нужны, если машина обучилась - то она обучилась.

M
На сайте с 18.10.2006
Offline
185
#147

А не важно :).

AESCBC192
На сайте с 11.06.2016
Offline
51
#148
_Snake_:
Возможно даже сами создатели уже не понимают по каким признакам она вычисляет спам

Понять можно, нейронку выгружают в список весов и видно какой признак "срабатывает" наиболее часто, иначе процесс обучения станет сложноконтролируемым, на многослойных сложноорганизованных должен быть спецсофт под анализ корелляций, но обратная связь нужна в любом случае.

В распознавании искаженной тектовой графики имхо смое сложное - это разделение на символы, отдельный символ по сетке не так сложно распознать, думаю самая перспективная сфера - это распознавание сложных объектов, а символы это по сути тот же текстораспознаватель для настольного сканера, только работающий с более зашумленным входом.

_Snake_
На сайте с 06.12.2010
Offline
151
#149

MO $$$, Почитай тут про самообучение. https://ru.wikipedia.org/wiki/%D0%9E%D0%B1%D1%83%D1%87%D0%B5%D0%BD%D0%B8%D0%B5_%D0%B1%D0%B5%D0%B7_%D1%83%D1%87%D0%B8%D1%82%D0%B5%D0%BB%D1%8F

---------- Добавлено 28.01.2017 в 03:28 ----------

AESCBC192:
Понять можно, нейронку выгружают в список весов и видно какой признак "срабатывает" наиболее часто, иначе процесс обучения станет сложноконтролируемым

Не всегда можно понять 🍿 https://geektimes.ru/post/281998/

Мы точно не понимаем, как работает этот метод шифрования, поскольку машинное обучение позволило получить результат без демонстрации пути его разработки. На практике это означает то, что мы не сможем получить понятный человеку способ шифрования, если он будет достаточно сложным. Практическое применение этой технологии, таким образом, ограничено.
AESCBC192
На сайте с 11.06.2016
Offline
51
#150

Похоже на то что я называл обучением методом последовательных сопоставлений, биологический аналог - импринтинг в нейрофизиологии, когда известен только конечный результат, далее подается вход, нейронка выводит гипотезу, подает сама себе на вход в сумме с начальным условием, - анализирует полученный результат и его эффективность, и так в цикле пока не отработает условие рузультата - цели, то есть не произойдет импинтирование на определенный раздражитель, составленный из суммы входа и реакции системы, реакция запоминается как наиболее оптимальная стратегия достижения результата.

---------- Добавлено 28.01.2017 в 05:23 ----------

AESCBC192:
Не всегда можно понять

Вообще я привел идеализированный вариант, на практике действительно не всегда получается понять что делает программа, если сложная то иногда очень сложно разобраться чем занимается алгоритм в данный момент, поэтому думаю нужно соврешенствовать методы обратной связи то есть интерфейсы.

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий