sokol_jack

Рейтинг
78
Регистрация
16.03.2008
Sекир:
Давайте я угадаю...
Шаблоны делаете программой Artisteer?

Думаю, не угадали.

Делает он из программой Artisteer 2 ;)

evgeny1:
Бред - это утверждать обратное, ни разу не сталкиваясь с доменами org.ua. Не зная о каком сайте идет речь, просто говорю, что если он хоть каким-то боком нарушает правила зоны org.ua по мнению админа org.ua, то решение о его закрытии он примет самостоятельно. Я не знаю случаев, когда админом org.ua закрывались "спорные домены" из-за ТМ, но очень много случаев закрытых "по правилам org.ua" лично админом.

Категорически согласен.

В зоне org.ua админ зоны - "известная" личность.

mpc:
Вместе с тем, по решению суда могут запретить контент на сайте, попадающий под классы, входящие в данную ТМ.

Именно это я и пытался сказать 🍻

zweroboy1:
Как вариант более-менее быстрого получения словаря с привязкой к тематике -
1. Парсинг ЯК (либо какого-то другого качественного каталога), создание базы вида УРЛ - тематика.
2. Заход робота на морду каждого из этих сайтов. Парсинг. В базу сохраняем все слова, кроме анкоров внешних ссылок. Словам из титлов, стронгов, мета-дескрипшнов придаём несколько больший вес. После прохождения этого шага имеем базу вида: Слово - Сайт - Число вхождений (Вес) - Тематика.
3. Анализ полученной базы. Делим все слова из базы на три категории:
3.1. Стоп-слова - они часто появляются во всех без исключения тематиках.
3.2. Средние слова - они часто встречаются в одной категории, но иногда попадаются и в других.
3.3. Хорошие слова - часто встречаются в какой-то конкретной рубрике, и практически не встречаются - в других.
4. Заходим на неизвестную страницу, опять же парсим её, анализируем найденные слова. В первую очередь обращаем внимание на хорошие слова из пункта 3.3. Думаю, этого будет достаточно в подавляющем большинстве случаев для правильного определения тематики.


В общем-то, реализуется такое за недельку без особого напряга одним челом.
Плюсы - не надо заморачиваться с морфологией и составлением базы вручную.
Алгоритм ТС будет скорей всего точнее этого, но он имеет большие шансы загнуться на стадии составления словаря с весами :)

Мысли очень правильные 🍻

Замечу только:

- морфология таки нужна - я все привожу к нормальной форме (тогда и совпадений больше). Можно простым стеммингом побаловаться.

- на ЯК хорошие результаты у меня дает даже просто парсинг каталога (тайтл + описание), без заходов на главную страницу и т.д. Тайтл с двойным коэф.

sokol_jack добавил 21.05.2009 в 21:27

kotofeich:
Человек помещая сайт в як дает тематику, в дальнейшем она может поменяться. Сомневаюсь что робот яндекса определит тематику аналогично админу яка.

А я - почти уверен.

Потому как те, кто оценивают работу робота ("ассесоры") и те, кто в ЯКе размещает мыслят почти одинаково (как и мы с вами).

Да и "эталонная" база у робота - почему бы и не ЯК?

MOP1:
Поступила претензия от конторки, которая обладает ТМ "Trademark"
домен выглядит как trademarktext.org.ua
на сайте каталог продукции этой конторы, обсуждения и тд и тп

ИМХО, проблема именно в том, что имя домена похоже на ТМ и на сайте про эту ТМ.

Если бы домен был просто canon.com, а на сайте например пушки или hp.com про High Power электростанции - тогда приколупаться сложнее...

kotofeich:
да, ознакомился недельку назад. Принял к сведению, но имхо там мысли от людей далеких от программирования. Они выдвигали теории, которые слабы в реализации.

Точно-точно. :D

Там пару человек которые "не очень далеки от программирования" (причем не только написания на коленке пхп-скриптиков простых) писали о уже готовых системах. 🍻

kotofeich:
Смотри - для меня это тема. Пару человек могут вчитаться и подсказать что-нибудь, поскольку здесь много народу набившего себе шишки. Теперь отбросим из сеошников всех, кто незнаком с программированием. Далее подумай сколько программистов сядут с целью повторить это? Очень сомневаюсь что наберутся полчеловека. А ведь нужна как минимум фирма с десятком человек для реализации алгоритма. Так что я не беспокоюсь о "палеве".

Да и вобще - все вокруг дураки, а котяра - весь в белом ;) 😂

Конечно, с топиком на форуме сапы вы ознакомились и там "все не правильно", да?

http://forum.sape.ru/showthread.php?t=30235

ДваждыДва:
1. Она снижает профессиональный профит

Это есть :)

2. Наплевательски относится и откровенно хамит людям, которые два месяца назед(грубо говоря) разжевывали ей каждый шаг ака блондинке.

"Неблагодарный ученик"? ;)

3. Неоднократно обманывает о собственных же действиях на аукционе(то домен она бросает, то подбирает), супер-хваленые бэки и мега-анализ на самом деле пб по большому счету. На днях проходился у себя в хистори по доменам(и саламбины мелькали) и тиц на многих нехило упал вниз(есть желание - сами проанализируйте темы, прочекайте домены теперь).

Так это задача покупателя беки поглядеть да оценить.

4. Считает весь подфорум говном по умолчанию, все человеческое ловно приписывая к пережитам "совка".

Что-то у кого-то критические дни. Не? :D

p.s. Дальше лень просто указывать на конкретные факты. Удивляет только армия защитников(вроде Вас) и наличие деловых партнеров в данной ветке. Что то задержался я, работать еще надо :)

Увы, я вовсе не из армии защитников (как бы вам этого не хотелось) 😂.

Вот только мой опыт общения (небольшой, кстати) с тем пользователем, который вам так неприятен, оставил скорее позитивный оттенок. Да и посты у нее "нейтрально-позитивные". Чего не скажешь о ваших, к сожалению. Если и юморите, то почему-то "по-черному".

ПыСы. И это - фантазий поменьше ;)

О, резиновый шаблон журнального типа за отзыв разобрал бы по косточкам. Никто не против? ;)

Crimeaboy:
Я считаю, что каждый сайт должен приносить прибыль!

Это похвально.

Разместите попапов, попандеров, ХХХ-баннеров - сайт принесет еще больше прибыли. 😂

А СДЛ (только не такие, как вы себе представляете) вполне приносят прибыль и без ТИЦ. 🚬

Всего: 1527