Это если мы о будущем каталога говорим.
А если о пользе, то обученным на его основе роботам (в т.ч. роботам гугла) все равно что будет с каталогом.
Мне вот интересно как вы будете скриптом, без применения головы ломать самопис в котором одно ядро)). PDO с параметрами, все формы принудительно с маркером от XSRF, санитаризация всего пользовательского ввода, отсутствие опасных конструкций вроде eval, и мне вот чисто интересно что найдет скрипт). Нет, накосячить может каждый. И взломать можно всех. Но обычно для этого нужно мозг включить.
Расскажете? Я вот не знаю.
Так а кого оно тут заинтересовать может?
Тут тех кто понять суть разговора от силы дюжина наберется).
Это надо или на ДФ или на д24, или на ПД идти с такими разговорами.
Все 100% поисковиков используют работу людей.
Можете называть это ассесорами.
Можете называть это поведенческими факторами.
Можете называть это "стук-стук на конкурентов".
Можете называть это как угодно, но ни одна машина не способна работать без порции человеческих данных.
Всегда нужна размеченная выборка.
ДМОЗ закроется.
Все клоны закроются.
Ни одной копии в сети не останется.
Ни одного нового каталога не появится.
Ни одного сайта который был в ДМОЗ больше не будет в онлайне.
Но польза от этой работы будет продолжать проявляться.
Все системы машинного обучения (равно как и человеческий мозг) используют свой опыт полученный на первых своих данных, даже когда и данных этих уже нет, и всё полностью поменялось.
Очень примитивно - робот находит закономерности в эталонах,
потом находит под них другие эталоны, схожие по закономерностям,
потом ищет уже более общие закономерности,
и ищет новые эталоны.
В какой-то момент от изначального не остается ничего, но "дело его не умрет".
Как у человека вроде за 7 лет (не помню, но есть какая-то цифра) меняется почти 100% атомов его тела. Но это тот-же человек.
ПС: очень бы хотел заполучить всю базу, как белых, так и черных сайтов. Много чего интересного можно было бы сделать.
ППС: простенький кейс, для скептиков и неопытных. Берем интересующий нас раздел каталога.
Прогоняем его по предпочитаемой системе статистики на тему поиска схожих сайтов (ли.ру, алекса, это то что использовал я, но таких вариантов полно). Натравливаем многосерч или кастомного паука. Дальше по вкусу. Можно уже по их контенту поиск делать, статистику собирать, или уже вручную перебрать список сайтов. Расширить выборку по ссылкам. Сузить выборку по тем или иным фильтрам. Например по желто-красным меткам отфильтровать).
Этот ВПН нужно поднимать. Сайт может быть на шареде и там не поднимешь. Ну и т.п.
Так оно не смешно пока не пришел. А если придет, то будет смешно)
Сложно. ТС уже озвучил, что киоск у них в одной локалке с манагерами. (тут кстати стоит про DMZ подумать, чтобы киоски не лазили по локалке, но задача все равно типичная, и решается настройками роутера).
Насколько я помню там дамп базы в открытом доступе был как у википедии, так что факт того что будет МНОГО клонов неизбежен. И в любом сообществе всегда есть недовольные. Помню я ушел из ДМОЗ потому что молод был и глуп (а не вернулся ибо времени лишнего уже не было), но я был уверен что злой и вредный редактор родительского к моему раздела "до меня докапался", хотя тот всего-то провел корректуру заголовков у добавленных мною сайтов. Юношеский максимализм... Опять же - будут изменения идеологии. И они части могут не понравится.
Весь вопрос в том смогут ли альтернативные клоны собрать хоть какое-то ядро редакторов. В целом по вспоминаниям о внутреннем форуме скорее разделяю ваш оптимизм, что ядро таки перейдет в одно место. Но сомнения у меня что тех кто перейдет таки хватит. Ведь это будет уже НОВЫЙ проект, и он может и не взлететь...
Не, я о том что использовать куки/сессию для определения факта того что у нас киоск - костыльно. Потеряли корзину - и черт с ней. Ситуация не каждодневная.
А вот потеряли флажок "isKiosk" - получили потенциальную утечку данных одного клиента к другому. Куки пишутся постоянно, шанс повреждения их файла высок. Настройки браузера меняют редко. Конфиг явно закрыт, и в кеше несохраненных данных нет, так что юзерагент будет надежнее.
Ну это если не делать отдельный домен и т.п.
Надо еще годик подождать, может кто-то один жирный и выплывет в предстоящей битве форков. Вот если явный лидер не наметится, куда уйдет большинство редакторов, тогда можно будет констатировать смерть.