"Нулевые" сателлиты и ссылки с них

1 234
cromizer
На сайте с 27.08.2008
Offline
29
#21

В личку отправил пример. Сделать качественный синонимизатор - несложно. Стоит немного поразмышлять и достать учебник русского языка - я его нашёл - прочитал - и как оказалось, что всё гениальное просто.

seo-шаман
ETNO
На сайте с 16.06.2008
Offline
117
#22

да, cromizer, предоставил текст с хорошим качеством в личку по очень сложной тематике(медицина). Но я просто не поверю, что также можно сделать любой текст на любую тематику. Просто дело видимо в хорошем вручную отобранном узкотематическом словаре. Хотя ХЗ, может он гений и у него получилось обойти все морфологические особенности русского языка.

Wordpress тема для заработка на партнерках (http://themeforest.net/item/rehub-directory-shop-coupon-affiliate-theme/7646339). Создание каталогов с фильтрацией, расширенный функционал обзоров, layout builder, еженедельное обновление.
cromizer
На сайте с 27.08.2008
Offline
29
#23

Тогда палю тему:

1. Парсим кучу тематического контента, выдёргиваем из страницы только текст статьи и определяем тошноту этой статьи, из него создаёт словарик для определённой тематики.

2. Получившийся список слов и словосочетаний прогоняем через словарь синонимов (словарь синонимов я собрал из 5 или 7 разных словарей, которые нашёл в сети), а так же через толковый словарь (с кратким толкованием). Далее тратим 1 - максимум 2 часа, на то, что бы вычистить базу от мусора типа старословянских слов и тд. - Сразу поясню - чистить базу синонимов изначально нет смысла, так как это очень долго (18 Мб в TXT) и можно по запаре вычистить нужные слова. Для чего краткий толковый словарь? А для того, что бы разбавить и уникализировать часть слов для которых нет синонимов или те, которые довольно редко встречаются и используются в тексте. Так как по этим словам можно довольно быстро найти дубль.

Например: Новость про Аршавина и Барселону - если мы посмотрим тошноту новости, то увидим, что основные слова, по которым можно нати дубль - Аршавин, Барселона, Зенит и тд. Если мы растолкуем эти слова (Аршавин - игрок Санкт-Петербургской футбольной команды и тд), то мы уходим из зоны риска попасть под фильтр определения нечётких дублей.

Про алгоритмы определения нечётких дублей читать http://rcdl2007.pereslavl.ru/papers/paper_65_v1.pdf

3. Далее. Мы можем работать с предложениями разбивая большие на маленькие и наоборот. А так же можем использовать уже готовые решения http://www.rvb.ru/soft/catalogue/catalogue.html

4. Так же при применении составленного словаря к только что украденному тексту используем http://company.yandex.ru/technology/mystem/ или phpmorphy (работает чётко) - определяем число, род и падеж и тд у слова или словосочетания в тексте, переводим в именит. падеж, ед. число... и находим красивый чистый синоним, далее переводим его в нужную форму и вставляем в текст.

5. В результате мы получаем текст на 40-80% отличный от оригинала + уникальный.

Со временем базы накапливаются и становятся более качественными и когда баз получается штук 10, мы их сравниваем и находим дубли - вот эти дубли начинают составлять обще тематический словарик, который можно использовать для генерации статей для постинга на левые сайты.

Может чего и упустил - 8 утра как никак - сон требуется. 🚬

Я думаю после такого разжёвывания - через 1-3 недели на форуме начнутся продажи скрипта этого синонимизатора.

K-style
На сайте с 11.02.2007
Offline
109
#24
minSEO:
Толк есть, вопрос стоит ли игра свеч. Ссылки лучше в тексте на морде размещать.

Вы долго исследовали этот вопрос ?

С Уважением, Станислав
Глумий
На сайте с 17.01.2007
Offline
71
#25
cromizer:
Я думаю после такого разжёвывания - через 1-3 недели на форуме начнутся продажи скрипта этого синонимизатора.

если бы. :) То, что вы рассказали либо уже используется теми, кто в этом силен, либо будет проигнорировано теми, кто слаб в программировании/русском.

ETNO, все зависит от словаря (читаемость текста). Можете глянуть /ru/forum/250463. Морфология там есть как раз

Подскажите, как помочь (/ru/forum/421370)? Читать не перечитать. Тысячи отсканированных журналов и книг с удобным просмотром и без рекламы. ReadOz (http://fff.to/1fY)
cromizer
На сайте с 27.08.2008
Offline
29
#26
K-style:
Вы долго исследовали этот вопрос ?

Да. Меня на это дело сподвигло одно очень денежное обстоятельство. Когда я скачав в инете какой то скрипт дорвея и насколько мне хватило знаний php его переделать и превести в вид болеее мение нормального сайта, сгенерив 6000 страниц - и он жил в течении 2-х недель и в день на контексте приносил по 40 уе - я начал более подробно изучать этот вопрос.

Я пока не добился того, что я действительно хочу - что бы робот сам сочинял текста - но я с каждым разом всё ближе и ближе к решению этого вопроса. Теперь для меня это стало хобби. Так как я ушёл от дорвеев и тд и занимаюсь теперь только SEO и созданием качественных сайтов. =)

MS
На сайте с 21.07.2008
Offline
216
#27
K-style:
Вы долго исследовали этот вопрос ?

Что вас смущает?

1. Любая ссылка передает какой-то вес.

2. Изначально ссылка с морды передает больше веса (в целом, частные случае не рассмативаю).

3. Ссылка с тематическим окружением, ИМХО, сыграет только в плюс, как донору, так и акрептору.

cromizer
На сайте с 27.08.2008
Offline
29
#28
Глумий:
если бы. :) То, что вы рассказали либо уже используется теми, кто в этом силен, либо будет проигнорировано теми, кто слаб в программировании/русском.
ETNO, все зависит от словаря (читаемость текста). Можете глянуть /ru/forum/250463. Морфология там есть как раз

Я видел эту тему. Я часто читаю форум. Правда вот только сегодня появилось желание зарегиться и то только потому что бы поругаться на флудеров в теме АП.

Касаемо программы - то самое основное это создание качественных словарей. Так как всё остальное это технические моменты, которые нормальный программер решит очень быстро. А вот сама идея сбора словарей - один из сложным моментов при создании синонимизатора. Главное придумать как их получать.

Olisher
На сайте с 22.11.2006
Offline
375
#29
cromizer:

Я пока не добился того, что я действительно хочу - что бы робот сам сочинял текста - но я с каждым разом всё ближе и ближе к решению этого вопроса. сайтов.

Когда Ваш робот научится приносить кофе в постель я у Вас его куплю.

По теме: Бред полный.

Яндекс уже учитывает многими способами тематичность и, соответственно, не естественность текста, особенно путем замены на синонимы где обороты остаются те же

ежели и есть столько естественного (несгенерированого контента) за 2л пива, то лучше б сделали из него полноценный сайт со статьями и интересной уникальной информацией и пустили бы этот сайт в дело, что касается размещения сотен нулевых сателлитов это просто пустая трата и безалаберность хотя бы по отношению к тем, кто писал эти тексты, ну и к себе конечно. Ощутимых подъемов Вы все-равно не добьетесь, а цена за тот подъем который можно обеспечить Вашим методом легче и быстрее в Сапе, заплатив несколько больше, но эффективней

Глумий
На сайте с 17.01.2007
Offline
71
#30

cromizer, как сделаете свою чудо-программу, дайте потестить :)

1 234

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий