mendel

mendel
Рейтинг
232
Регистрация
06.03.2008
HotLab:
mendel, но давай взглянем с другой стороны. Ничто не вечно. Сайты создаются и закрываются. Если БД каталога не будет иметь подпитки, то через какое-то время количество сайтов начнет падать, т.к. часть просто закроется (не продлят домен, взломают, продадут и т.д. и т.п.). Как следствие падает и качество каталога. И тут есть 2 пути развития, модераторы чистят мертвые сайты. Или же всем уже плевать и каталог обрастает битыми ссылками.

Это если мы о будущем каталога говорим.

А если о пользе, то обученным на его основе роботам (в т.ч. роботам гугла) все равно что будет с каталогом.

SocFishing:
Aisamiery, ну а смысл писать CMS из 2-3 функций? drupal ядро, без сторонних модулей фиг взломаешь, аналогичный самопис крутанет на пипирке любой мидл с метасплоитом.

Мне вот интересно как вы будете скриптом, без применения головы ломать самопис в котором одно ядро)). PDO с параметрами, все формы принудительно с маркером от XSRF, санитаризация всего пользовательского ввода, отсутствие опасных конструкций вроде eval, и мне вот чисто интересно что найдет скрипт). Нет, накосячить может каждый. И взломать можно всех. Но обычно для этого нужно мозг включить.

Sitealert:
И кстати, помните уязвимость с PDO в Друпале? Ядро ведь, однако.

Расскажете? Я вот не знаю.

Игорь К:
Ну что, как оказалось, тема про домен aliexpress.ua, его торговую марку и судебные разборки здешний народ не заинтересовала! Жаль!)

Так а кого оно тут заинтересовать может?

Тут тех кто понять суть разговора от силы дюжина наберется).

Это надо или на ДФ или на д24, или на ПД идти с такими разговорами.

Каширин:
Это здорово, что вы хотите продолжите заниматься интересным для вас делом. Но зачем этот каталог аудитории? А не редакторам. Я вообще не понимаю, зачем наряду с поисковыми системами нужны каталоги сайтов. 2-3 слова - и каталог сайтов, причем на любую тему, готов.
HotLab:
Логично, что редакторам обидно, что проделали такую работу в пустую, но это жизнь, ничто не вечно. Все меняется ...

Все 100% поисковиков используют работу людей.

Можете называть это ассесорами.

Можете называть это поведенческими факторами.

Можете называть это "стук-стук на конкурентов".

Можете называть это как угодно, но ни одна машина не способна работать без порции человеческих данных.

Всегда нужна размеченная выборка.

ДМОЗ закроется.

Все клоны закроются.

Ни одной копии в сети не останется.

Ни одного нового каталога не появится.

Ни одного сайта который был в ДМОЗ больше не будет в онлайне.

Но польза от этой работы будет продолжать проявляться.

Все системы машинного обучения (равно как и человеческий мозг) используют свой опыт полученный на первых своих данных, даже когда и данных этих уже нет, и всё полностью поменялось.

Очень примитивно - робот находит закономерности в эталонах,

потом находит под них другие эталоны, схожие по закономерностям,

потом ищет уже более общие закономерности,

и ищет новые эталоны.

В какой-то момент от изначального не остается ничего, но "дело его не умрет".

Как у человека вроде за 7 лет (не помню, но есть какая-то цифра) меняется почти 100% атомов его тела. Но это тот-же человек.

ПС: очень бы хотел заполучить всю базу, как белых, так и черных сайтов. Много чего интересного можно было бы сделать.

ППС: простенький кейс, для скептиков и неопытных. Берем интересующий нас раздел каталога.

Прогоняем его по предпочитаемой системе статистики на тему поиска схожих сайтов (ли.ру, алекса, это то что использовал я, но таких вариантов полно). Натравливаем многосерч или кастомного паука. Дальше по вкусу. Можно уже по их контенту поиск делать, статистику собирать, или уже вручную перебрать список сайтов. Расширить выборку по ссылкам. Сузить выборку по тем или иным фильтрам. Например по желто-красным меткам отфильтровать).

Aisamiery:
Внутри локальной сети у вас все IP разные, что манагеры, что киоск будут иметь уникальный IP и сервер прокинутый по vpn в локальную сетку будет иметь тоже свой IP отличный от публичного. Но с этим вопросом лучше к админам, я так, чисто в теории понимаю как это работает.

Этот ВПН нужно поднимать. Сайт может быть на шареде и там не поднимешь. Ну и т.п.

demiux:
Sitealert, про милторга уже не смешно, упоминаете его чуть ли в каждом третьем посте

Так оно не смешно пока не пришел. А если придет, то будет смешно)

Aisamiery:
Закрываете доступ в инет совсем, прокидываете vpn до сервера, чтоб они были в одной сети, прописываете настройки куда за сайтом стучаться, так и работает в режиме киоск на полный экран, но со всеми разрешениями.

Сложно. ТС уже озвучил, что киоск у них в одной локалке с манагерами. (тут кстати стоит про DMZ подумать, чтобы киоски не лазили по локалке, но задача все равно типичная, и решается настройками роутера).

Tanstaafl:
Думаю, что каталог будет ровно один (сообщество довольно цельное в этом отношении); делиться крайне невыгодно.

Насколько я помню там дамп базы в открытом доступе был как у википедии, так что факт того что будет МНОГО клонов неизбежен. И в любом сообществе всегда есть недовольные. Помню я ушел из ДМОЗ потому что молод был и глуп (а не вернулся ибо времени лишнего уже не было), но я был уверен что злой и вредный редактор родительского к моему раздела "до меня докапался", хотя тот всего-то провел корректуру заголовков у добавленных мною сайтов. Юношеский максимализм... Опять же - будут изменения идеологии. И они части могут не понравится.

Весь вопрос в том смогут ли альтернативные клоны собрать хоть какое-то ядро редакторов. В целом по вспоминаниям о внутреннем форуме скорее разделяю ваш оптимизм, что ядро таки перейдет в одно место. Но сомнения у меня что тех кто перейдет таки хватит. Ведь это будет уже НОВЫЙ проект, и он может и не взлететь...

Sitealert:
Не забывайте, что речь идёт об интернет-магазине, и корзина чаще всего лежит в сессии. Поэтому по-любому: потеряли сессию - потеряли корзину. Так что тут так и так нужна привязка к сессии.

Не, я о том что использовать куки/сессию для определения факта того что у нас киоск - костыльно. Потеряли корзину - и черт с ней. Ситуация не каждодневная.

А вот потеряли флажок "isKiosk" - получили потенциальную утечку данных одного клиента к другому. Куки пишутся постоянно, шанс повреждения их файла высок. Настройки браузера меняют редко. Конфиг явно закрыт, и в кеше несохраненных данных нет, так что юзерагент будет надежнее.

Ну это если не делать отдельный домен и т.п.

MAzZYBiG:
Пользуясь случаем передаю привет редактору Cell, который всегда верил в непотопляемость ДМОЗа. Не то, чтобы я злорадствую, но ты проиграл

Надо еще годик подождать, может кто-то один жирный и выплывет в предстоящей битве форков. Вот если явный лидер не наметится, куда уйдет большинство редакторов, тогда можно будет констатировать смерть.

Всего: 1906