- Поисковые системы
- Практика оптимизации
- Трафик для сайтов
- Монетизация сайтов
- Сайтостроение
- Социальный Маркетинг
- Общение профессионалов
- Биржа и продажа
- Финансовые объявления
- Работа на постоянной основе
- Сайты - покупка, продажа
- Соцсети: страницы, группы, приложения
- Сайты без доменов
- Трафик, тизерная и баннерная реклама
- Продажа, оценка, регистрация доменов
- Ссылки - обмен, покупка, продажа
- Программы и скрипты
- Размещение статей
- Инфопродукты
- Прочие цифровые товары
- Работа и услуги для вебмастера
- Оптимизация, продвижение и аудит
- Ведение рекламных кампаний
- Услуги в области SMM
- Программирование
- Администрирование серверов и сайтов
- Прокси, ВПН, анонимайзеры, IP
- Платное обучение, вебинары
- Регистрация в каталогах
- Копирайтинг, переводы
- Дизайн
- Usability: консультации и аудит
- Изготовление сайтов
- Наполнение сайтов
- Прочие услуги
- Не про работу
Что делать, если ваша email-рассылка попала в спам
10 распространенных причин и решений
Екатерина Ткаченко
Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий
В личку отправил пример. Сделать качественный синонимизатор - несложно. Стоит немного поразмышлять и достать учебник русского языка - я его нашёл - прочитал - и как оказалось, что всё гениальное просто.
да, cromizer, предоставил текст с хорошим качеством в личку по очень сложной тематике(медицина). Но я просто не поверю, что также можно сделать любой текст на любую тематику. Просто дело видимо в хорошем вручную отобранном узкотематическом словаре. Хотя ХЗ, может он гений и у него получилось обойти все морфологические особенности русского языка.
Тогда палю тему:
1. Парсим кучу тематического контента, выдёргиваем из страницы только текст статьи и определяем тошноту этой статьи, из него создаёт словарик для определённой тематики.
2. Получившийся список слов и словосочетаний прогоняем через словарь синонимов (словарь синонимов я собрал из 5 или 7 разных словарей, которые нашёл в сети), а так же через толковый словарь (с кратким толкованием). Далее тратим 1 - максимум 2 часа, на то, что бы вычистить базу от мусора типа старословянских слов и тд. - Сразу поясню - чистить базу синонимов изначально нет смысла, так как это очень долго (18 Мб в TXT) и можно по запаре вычистить нужные слова. Для чего краткий толковый словарь? А для того, что бы разбавить и уникализировать часть слов для которых нет синонимов или те, которые довольно редко встречаются и используются в тексте. Так как по этим словам можно довольно быстро найти дубль.
Например: Новость про Аршавина и Барселону - если мы посмотрим тошноту новости, то увидим, что основные слова, по которым можно нати дубль - Аршавин, Барселона, Зенит и тд. Если мы растолкуем эти слова (Аршавин - игрок Санкт-Петербургской футбольной команды и тд), то мы уходим из зоны риска попасть под фильтр определения нечётких дублей.
Про алгоритмы определения нечётких дублей читать http://rcdl2007.pereslavl.ru/papers/paper_65_v1.pdf
3. Далее. Мы можем работать с предложениями разбивая большие на маленькие и наоборот. А так же можем использовать уже готовые решения http://www.rvb.ru/soft/catalogue/catalogue.html
4. Так же при применении составленного словаря к только что украденному тексту используем http://company.yandex.ru/technology/mystem/ или phpmorphy (работает чётко) - определяем число, род и падеж и тд у слова или словосочетания в тексте, переводим в именит. падеж, ед. число... и находим красивый чистый синоним, далее переводим его в нужную форму и вставляем в текст.
5. В результате мы получаем текст на 40-80% отличный от оригинала + уникальный.
Со временем базы накапливаются и становятся более качественными и когда баз получается штук 10, мы их сравниваем и находим дубли - вот эти дубли начинают составлять обще тематический словарик, который можно использовать для генерации статей для постинга на левые сайты.
Может чего и упустил - 8 утра как никак - сон требуется. 🚬
Я думаю после такого разжёвывания - через 1-3 недели на форуме начнутся продажи скрипта этого синонимизатора.
Толк есть, вопрос стоит ли игра свеч. Ссылки лучше в тексте на морде размещать.
Вы долго исследовали этот вопрос ?
Я думаю после такого разжёвывания - через 1-3 недели на форуме начнутся продажи скрипта этого синонимизатора.
если бы. :) То, что вы рассказали либо уже используется теми, кто в этом силен, либо будет проигнорировано теми, кто слаб в программировании/русском.
ETNO, все зависит от словаря (читаемость текста). Можете глянуть /ru/forum/250463. Морфология там есть как раз
Вы долго исследовали этот вопрос ?
Да. Меня на это дело сподвигло одно очень денежное обстоятельство. Когда я скачав в инете какой то скрипт дорвея и насколько мне хватило знаний php его переделать и превести в вид болеее мение нормального сайта, сгенерив 6000 страниц - и он жил в течении 2-х недель и в день на контексте приносил по 40 уе - я начал более подробно изучать этот вопрос.
Я пока не добился того, что я действительно хочу - что бы робот сам сочинял текста - но я с каждым разом всё ближе и ближе к решению этого вопроса. Теперь для меня это стало хобби. Так как я ушёл от дорвеев и тд и занимаюсь теперь только SEO и созданием качественных сайтов. =)
Вы долго исследовали этот вопрос ?
Что вас смущает?
1. Любая ссылка передает какой-то вес.
2. Изначально ссылка с морды передает больше веса (в целом, частные случае не рассмативаю).
3. Ссылка с тематическим окружением, ИМХО, сыграет только в плюс, как донору, так и акрептору.
если бы. :) То, что вы рассказали либо уже используется теми, кто в этом силен, либо будет проигнорировано теми, кто слаб в программировании/русском.
ETNO, все зависит от словаря (читаемость текста). Можете глянуть /ru/forum/250463. Морфология там есть как раз
Я видел эту тему. Я часто читаю форум. Правда вот только сегодня появилось желание зарегиться и то только потому что бы поругаться на флудеров в теме АП.
Касаемо программы - то самое основное это создание качественных словарей. Так как всё остальное это технические моменты, которые нормальный программер решит очень быстро. А вот сама идея сбора словарей - один из сложным моментов при создании синонимизатора. Главное придумать как их получать.
Я пока не добился того, что я действительно хочу - что бы робот сам сочинял текста - но я с каждым разом всё ближе и ближе к решению этого вопроса. сайтов.
Когда Ваш робот научится приносить кофе в постель я у Вас его куплю.
По теме: Бред полный.
Яндекс уже учитывает многими способами тематичность и, соответственно, не естественность текста, особенно путем замены на синонимы где обороты остаются те же
ежели и есть столько естественного (несгенерированого контента) за 2л пива, то лучше б сделали из него полноценный сайт со статьями и интересной уникальной информацией и пустили бы этот сайт в дело, что касается размещения сотен нулевых сателлитов это просто пустая трата и безалаберность хотя бы по отношению к тем, кто писал эти тексты, ну и к себе конечно. Ощутимых подъемов Вы все-равно не добьетесь, а цена за тот подъем который можно обеспечить Вашим методом легче и быстрее в Сапе, заплатив несколько больше, но эффективней
cromizer, как сделаете свою чудо-программу, дайте потестить :)