- Поисковые системы
- Практика оптимизации
- Трафик для сайтов
- Монетизация сайтов
- Сайтостроение
- Социальный Маркетинг
- Общение профессионалов
- Биржа и продажа
- Финансовые объявления
- Работа на постоянной основе
- Сайты - покупка, продажа
- Соцсети: страницы, группы, приложения
- Сайты без доменов
- Трафик, тизерная и баннерная реклама
- Продажа, оценка, регистрация доменов
- Ссылки - обмен, покупка, продажа
- Программы и скрипты
- Размещение статей
- Инфопродукты
- Прочие цифровые товары
- Работа и услуги для вебмастера
- Оптимизация, продвижение и аудит
- Ведение рекламных кампаний
- Услуги в области SMM
- Программирование
- Администрирование серверов и сайтов
- Прокси, ВПН, анонимайзеры, IP
- Платное обучение, вебинары
- Регистрация в каталогах
- Копирайтинг, переводы
- Дизайн
- Usability: консультации и аудит
- Изготовление сайтов
- Наполнение сайтов
- Прочие услуги
- Не про работу
Зачем быть уникальным в мире, где все можно скопировать
Почему так важна уникальность текста и как она влияет на SEO
Ingate Organic
Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий
Сел писать модуль генерации текста и че то завис.. Как лучше
1. Брать кусок какого то готового ТЕМАТИЧНОГО текста и через определеннный промежуток разбавлять кеями.
2. НЕТЕМАТИЧНЫЙ текст брать.
3. Генерить абсолютную ересь по словарю слов + киворды время от времени.
4. Чисто кеи, а текст брать синонимизированный
5. ваш вариант.
Если есть идеи и способы отпишите плиз, так или иначе дорген планируется сделать бесплатным (это будет модификация тиражера)..
Первые четыре - такой бред если честно. Он будет НЕУНИКАЛЬНЫМ. Зачем он такой? Третий - тупо, лучше Марков.
Сделаете - http://www.cultseo.ru/seo/algoritm-generacii-dorveya/ и будет вам счастье
я и vitvvs'ом как-то задумались на эту тему и вот что у нас получилось. Посмотрите и вам многое станет понятно.
su-root, Вот это я понимаю - заморочились )
И как? Эффект хоть есть? Только честно :)
Генерирует неплохо, практически рассказы пишет. Когда читаешь понятно что бред, но с морфологией там все ок. Прошел по ссылке, данной вами почитал:
не совсем так. Надо скорее определить переходность глагола, для того, чтоб он встал на свое место. Есть переходные глаголы и без частички "ся"...
Ну я же там смеюсь ) Специально смайлик поставил.
Неужели нужно прямолинейно объявлять - Внимание! Сейчас шутка!
сам тоже собрался писать генератор, точнее написал прогу по импорту на ucoz сайты, остался только генератор, но я думаю не заморачиваться и обычный синомайзер прикрутить + рандомная вставка кеев в зав-ти от плотности.
Сделаете - http://www.cultseo.ru/seo/algoritm-generacii-dorveya/ и будет вам счастье
Что то подобное делал только не для доров, а для ГС для продажи ссылочного, там как раз делал обратную оптимизацию, чтобы трафика мало шло(меньше нагрузки на хостинг, меньше вероятность стука).
Немного только другая концепция была:
1. Союзы знаки пунктуации не мусор, а важный связующий член предложения.
2. С определением глаголов проблем не было, в словаре Зализняка все есть, сложнее с существительными например с географическими названиями. К тому-же предложения может быть и без подлежащего или сказуемого, или без обоих.
3. Блоки выбирал исходя из верстки и знаков препинания, например </p>, </br> и т.д. обрывают предложения. Удалялся мусор в виде меню, и постоянно присутствующих блоков.
4. Делается максимально возможный разбор предложения(до конца так пока и не удалось сделать, велик и могуч Русский язык), выявляются согласования частей предложения, например дом может быть у дороги, но не может быть в океане, все найденный части удаляются.
5. Кусок предложения который остался после п.4 дополнятся по алгоритму обратному п.4
6. ????????.
7. Profit.
Помнится, когда-то очень сильно заморачивался этой темой. Написал пару генераторов, но на выходе получалась такая ересь, что использовать ее где-то, не имело смысла. Вообще, не реально написать генератор текста на русском языке, который бы смог выдать текст, способный заставить человека поверить в то, что это текст написан человеком. Для доров вполне подойдет текст, который будет в состоянии пройти проверку алгоритмом ПС на принадлежность его к тексту для людей. Так как, ПС не может выявить смысловую нагрузку (а точнее ее отсутствие) текста прямым путем (путем осознания), значит она проверяет текст(ы) другим более приметивным способом. Логичнее всего предположить, что проверяется место слов, то есть, берем предложение и смотрим какое слово идет за следующим словом (примерно так же как работает генерация по цепям Маркова), на следующем этапе проверяем процент действительного употребление данного порядка слов в русском языке. И если процент встречаемости слов не превышает какого-то порогового значения, то алгоритм принимает решение, исключить данный текст из результатов поиска, так как он не несет никакой смысловой нагрузки, а является тупым набором слов. Но тут появляется спорная ситуация, ведь Марковка уже давно не рулит, значить данный способ проверки текстов не является правильным, но.. Как всегда есть одно но. "Марков" генерирует текст основываясь на случайности, то есть, если данный порядок слов встречается в тексте (здесь размер текста не имеет никакого значения) всего 1(!!!) раз, то данный порядок слов является равновероятным(!!!) в сравнении с другим порядком слов, который встречается в тексте более (возможно знакительно более) одного раза. Отсуда вывод, что "Марков" не в состоянии подняться выше порогового значения, и как следствие исключение текстов им сгенерированных из индекса.
По пункту 4 можно поделить только по семантическому признаку... Пространство и место а другая пачка слов это предметы и их части. Соответственно пространства то-же бывают разными: конечна же топонимы, пространства, вместилища, множества и имена классов. И так далее... После такой обработки (гемор конечна) ляпов в тексте будит еще меньше.
Мда, вот и все люди из этого раздела, у которых есть голова :)
Ну, чутка подскажу :) Значит, как уже правильно сказал su-root, слова должны быть разбиты на группы, т.к. простейшая морфологическая подмена при сложных структурах предложений выдает очень кислые варианты. А если фильтровать союзы, предлоги и знаки препинания - выходит вообще такая ересь, так что изначально надо ставить цели создать качественную структуру предложения.
Под этим понятием я подразумеваю не просто определить морфологию каждого слова и сделать под ним подмену, а так же выделить группу, к которой то или иное слово относится. Например в шаблоне глагол "отправить" нельзя заменять на "залезть" - т.к. после этих слов существительные должны идти в разных падежах.
Это такой вот маленький кусочек, что б людям не представлялся весь этот процесс в радужных тонах ;)