Dzhem

Dzhem
Рейтинг
77
Регистрация
24.04.2008

В данный момент программа работает со словами при полном совпадении, к примеру есть слово ангел в базе, со словом ангел в тексте будут проводиться операции, а со словами ангелы, ангелов, ангелочки - нет. Как начнем заполнять базу - программа будет со всеми словоформами работать

Dzhem добавил 12.02.2010 в 15:36

Linyli:
Попробовала. Пока не вставилось ни одного ключа.
Я взяла текст со страницы сервиса, где речь идет про базы. В качестве ключа указала слово "синонимы". Почему-то нигде не вставилось.

пока не вставляются. если только в базе синоним найден - то да. Через пару дней данная опция будет доступна. Сейчас это нереально сделать, так как нужно очень много текстов.

Вот выкладываю нынешний результат.

http://allsynonyms.ru/

База никакая, не судите что плохо синонимирует. Это временно. Ключевики - пока по 1 слову в ключе можно использовать. По мере наполнения базы можно будет СЧ и НЧ ключи использовать.

Для этого просто очень много текстов надо. Роботы на сайте работают, чешут просторы интернета, ищут нужные выражения для составления длинных ключей и для ранжировки текста автоматически. - Ну и немного грамотно надо будет мне продумать этот алгоритм конечно.

Завтра будет возможность на сайте добавлять синонимы в базу.

Если у кого есть какая база синонимов, в любом виде, прошу скинуть. Можно еще работать методом исключения. Сделать громадную базу и удалять ненужное :)

Flyer:
У яндекса есть 'слепок' новостей в режиме 'он-лайн'. Он прекрасно понимает, что это именно новость. Ставьте ссылку на первоисточник. Это хороший тон.

Спасибо, займусь

mursoul:
НУ если такое дело то ТСу нужно разлогинется в гугле и подчистить куки... И все встанет на свои места.
Тс
У гугла есть такой свой свойство, он(оно) запоминает те сайты по которым вы переходили и под ссовывает вам их в ваш топ…

Точно. Разлогинился - и нет результатов :(

Вот блин :)

Буду работать дальше. активно закупаю ссылки

bimcom:
Какой же квалификации должен быть этот человек 😮 😕

дело не в квалификации. Дело, как Вы сказали, в могуществе русского языка. если учитывать что надо синонимы к 200 000 слов, пусть в среднем по 5 синонимов = 1 000 000 слов добавить. Если обговорить с людьми по 1 рублю но чтоб тщательно слово проверяли, все падежи и т. д. - выходит лимон :( И то не факт что все грамотно будет. По-этому отпадает данный метод

Критика это конечно хорошо, нужная вещь, аидешь то что раньше не видел, но давате подождем денечек, уверен, критика сменится только на пожелания и советы

FANTiK123:
значит синонимизации не будет, будет простая вставка ключевиков? Но это не есть гуд хоть и правильная вставка, зачем только из-за этого мозг напрягать ))))

Вы вводите текст. вводите ключевики. вводите сколько вам надо ключевиков, вводите на сколько процентов сделать текст уникальным.

программа все это анализирует. ключевик если встречается в тексте - его не тогает. остальное синонимизирует. если ключей не хватает - дополняет ключевиками.

Все это анализируется программой и выдается вам в очень читабельном виде, без единой ошибки.

Теоретически ошибки могут возникать только из-за корявости базы синонимов. С этим буду конкретно бороться. Завтра к вечеру надеюсь будет готова довольно сырая версия, с лажовой базой. Но она вам даст все ответы на все ваши вопросы. Текст будет синонимироваться коряво, так как база плохая, но с ключевиками работать спокойно сможет, сможет их добавлять. Думаю это многих заинтересует и народ поможет в развитии проекта.

Dzhem добавил 11.02.2010 в 22:28

bimcom:
У меня такое чувство что завтра вы только поймете с чем связались :) Русский язык он могуч.

А вот этого не советовал бы - засрут все.

не засрут. там половина делов будет учитываться роботом, который все это будет проверять. Да и будет модерация слов перед допущением в базу

У самого изначально была мысль нанять человека который будет синонимы добавлять. Но это нереально. бюджет уходит в миллионы рублей.

В общем ждите господа и дамы завтра к вечеру результатов. Я на все свои работы забил и сейчас занимаюсь именно этим проектом :)

Домен через несколько часов заработает.

Dzhem добавил 11.02.2010 в 22:31

Genux:
Наивный 😂

База синонимов – это 98% от самого синомайзера. Внешняя оболочка – это мелочи.

Без труда не вынешь и рыбку из пруда. Коль хочешь рыбку без труда - иди на платные пруда.

А денюшку что ты заплатишь - я потрачу на пополнение базу.

bimcom:
Если такое удастся дорвейщики вас на руках носить будут :) ток заложите в алгоритме возможность указания ключевиком фразы из нескольких слов.
Буду пристально следить за вашей темой.

Спасибо. Рад любым дополнениям, замечаниям. Думаю завтра к вечеру можно будет тестировать проект, правда с поганой базой, там уж кому проект интересен, надеюсь помогут составить идеальную базу

FANTiK123:
если я правильно понял, то сколько введешь ключевиков, столько и произойдет замен, значит на текст их 200 слов, надо как минимум 50 ключевиков вбивать
ждем первых результатов....

Нет. Замен не будет. Ввели вы к примеру слово магазин ключевиком. захотели чтоб оно отображалось 7 раз. 2 рза в тексте встречается слово магазин. скрипт его менять не будет. он добавит еще 5 раз магазин, причем в разных падежах и склонениях и вставит в нужные места, и при этом текст будет читабельным.

Dzhem добавил 11.02.2010 в 21:59

bimcom:
VPS с сотней - другой IP адресов решает эту проблему элементарно.


Я поделился опытом по наступанию на грабли, но как вы на них будите наступать никому не известно.

Я их обойду)))

Linyli:
А яндекс не банит за такие дела? Насколько я знаю, к яндекс.xml можно за сутки не больше 1000 запросов посылать, если не на договорной основе.

есть на это дело прокси сервера ;) да и 1000 запросов в день хватит)))

Всего: 100