То есть ваша гениальная идея уперлась в туже проблему что и все синонимайзеры - в базу синонимов, а как все начиналось....
Даю наводку подходящие синонимы для той или иной пары слов сама поисковая система может дать. (покрайне мере так у меня было)
Какой же квалификации должен быть этот человек 😮 😕
У меня такое чувство что завтра вы только поймете с чем связались :) Русский язык он могуч.
А вот этого не советовал бы - засрут все.
Если такое удастся дорвейщики вас на руках носить будут :) ток заложите в алгоритме возможность указания ключевиком фразы из нескольких слов.
Буду пристально следить за вашей темой.
С таким подходом лучше 200 слов синонимизировать по старинке :) - рерайтом.
VPS с сотней - другой IP адресов решает эту проблему элементарно.
Я поделился опытом по наступанию на грабли, но как вы на них будите наступать никому не известно.
Вы с начала прикиньте:
количество слов в русском языке
250 000 - 300 000
пусть ваш парсер будет обрабатывать всего 50 000 слов, тоесть 50кХ50к парных словосочетаний (запариваться с тем что не все слова образуют пары не будем - т.к. и так базу сузили)
теперь учитываем что у каждого слова может быть 6 падежей и 3 времени, падежи срезаем в 2 раза до 3х, время трогать нельзя, итого имеем для пар
50000x3х3х50000х3х3=202 500 000 000 запросов придется сделать только к одной поисковой системе, можно конешно это все делать на библиотеке Мошкова или аналогах, но базка получится литературная, а не интернетная.
Дело в том что сам делал такой велосипед, он получился, но парсер работал в реальном времени, не накапливая базу, в итоге на синонимайз 2000 символов уходдило порядка 2-5 тысяч запросов к яндексу (много ступеней проверки человечности написанного было), но все равно всплывали иногда косяки с морфологией в местах стыка (пока разработку отложил)
Чета ваша гениальная идея уж очень похожа на идею "под каждую тему материала своя база синонимов" только тематику вы предлагаете заменить ключевиками, которые ещё и самим нужно придумывать, да ещё и к яндексу с запросами ломиться, это все класно выглядит на коротких текстах, а вот на длинных, х..ня получится.
PS.
Чтобы небыло дискуссий дайте результаты инструмента посматреть, если они будут на высоте, то интерес будет.
Совершенно верно!
Вот и нужно объяснять и изменять мир хостинга наконец то.
Только вот проблема с
Есть тяжелый сайт размером 2000ГБ, на мирхотинге он поместится только за $18 а у приведенного мной хостера свободно сидит на 10ГБ и 300р в месяц + остается ещё и много других ресурсов.
Такчто ждем изменения мира хостинга.
только что увидил лимиты трафика - это уже ппц..
Сообщение я писал в 15-00, укажите тогда в каком часовом поясе вы работаете.
Цены в России на хостинг в принципе у всех игроков грабительские, но даже сравнивая их (все смысла нет, сравню тех на ком свой выбор остановил)............подумал и решил что лучше этого не делать:
- это ваш топик
- сравнить адекватно я не смагу, как оказалось все однозначно сравнить не получится - отличия в стоимости при разных сроках сравнения, отличие количества БД, парковочных сайтов, места под сайты, бд, вашу техподдержку у меня возможности проверить нет.......
так что сравните сами (в личку отправил)