DrJeans

DrJeans
Рейтинг
231
Регистрация
06.07.2006
Avelon:
давайте-давайте
исправлять потом будет дольше чем сразу сделать

Вах! Налетай, пока Avelon не передумал! 🚬

Ну вы блин, даёте! Только в САПЕ согласились дать "верёвку" для внешней выгрузки, а им тут уже и управление подавай. Всему своё время.

По ТЗ есть комменты, дополнения?

Avelon:
напишите ТЗ - рассмотрим

  <?xml version="1.0" encoding="windows-1251" ?> 

- <rss version="2.0">
- <channel>
<account>Nic_name_account</account>
<link_status_OK>896</link_status_OK> (Всего ссылок в статусе OK)
<day_summ>56</day_summ> (Общий дневной бюджет)
<month_summ>1560</month_summ> (Прогнозируемый месячный бюджет)
<balans>367</balans> (Баланс)
<new_price_link>7</new_price_link> (Новые цены на 7 ссылок)

- <item>
<project>Porject_1</project> (Название проекта)
<recipient>http://recipient_1.ru/path</recipient> (страница рецип.)
<donor>http://donor_1.ru/path</donor> (страница сайта донора)
<link><![CDATA[ txt bla <a href="http://recipient_1.ru/path">anchor</a> bla txt
]]></link> (текст и ссылка, размещ. у донора)
<price>0.80</price> (цена за ссылку)
<ur_vlojen>2</ur_vlojen> (уровень влож. страницы донора)
<pr>1</pr> (PR страницы донора)
<cy>425</cy> (тИЦ сайта)
<vnesh_ssylok>4</vnesh_ssylok> (исходящие ссылки со страницы дон.)
<id_donor>1234567</id_donor> (ID донора)
<status>OK</status> (статус ссылки: ERROR, OK...)
<new_price>NO</new_price> (новая цена: YES, NO)
<pubDate>Sat, 15 Sep 2007 03:18:00 +0400</pubDate> (дата размещения)
</item>
</channel>
</rss>

Первичный вариант, если что упустил или где ошибся просьба попроавить и дополнить.

__SPiRiT__:
Если вам нужен экспорт, то чем не подходит
http://sape.ru/links.php?act=export_link_urls_with_prices_and_dates
?

Там есть количество исходящих с каждого донора, состояние ссылки на доноре? Обратитесь к этой конструкции с сервера по крону... 🚬

Уже было сказано, выше, что экспорт на САПЕ есть, но для детального анализа необходим более гибкий и удобный инструмент. Саппорту САПЫ нет нужды делать доп. функции для оптимизаторов, они и так уже сделали очень много, да и не нужны эти функции в массах. Я прошу лишь дать мне доступ ко всей информации моих аккаунтов в едином стандартизированном виде, чтобы я мог собрать её всю в одном месте одним нажатием кнопки.

mihan:
DrJeans, сорри, подскажи, это только для рекламодателей плюс?

Если веб-мастеру скрывать нечего, то от такой тулзы ему ни холодно, ни жарко. Выгрузка на САПЕ есть и сейчас, но она не такая, чем могла бы быть через XML. Если задасться целью, то всю инфу, что перечислена в потоке можно и так сдёрнуть, но при наличии разных аккаунтов, на которых ведутся проекты - это не совсем удобно.

upyrj:
мне кажется, сама ссылка должна отдаваться в виде CDATA как упрощенный html:
<link><![CDATA[
txt bla <a href="http://recipient_1.ru/path">anchor</a> bla txt

]]></link>

Кстати, при наличии такого единого формата можно универсальные ссылкоблочные плагины для CMS делать, не завися от конкретной биржи! Да и прямые покупки можно легко на эдакий LinkML пересадить.

+! Согласен!

К этому формату можно привести "любые источники" извлечения доноров, облака анкоров, околоссылочный текст и т.д.

upyrj:
Поддерживаю. На днях напишу соображения в саппорт SAPE и CLX (коими пользуюсь).
Собственно, не мешало бы всем биржам ссылок такое замутить. 8)

Для стандартизации потока было бы очень даже, но нужно хотябы начать с чего-то. Количество самописных фич растёт как грибы и каждый "свой огород городит". Было бы гораздо проще когда входные данные для работы стандартизированы. Вот ещё добавил в поток инфы, для полноты картины автоматизации анализа.

- <item>

<project>Porject_1</project>
<recipient>http://recipient_1.ru/path</recipient>
<donor>http://donor_1.ru/path</donor>
<anchor>txt bla #a#anchor#/a# bla txt</anchor>
<price>0.80</price>
<ur_vlojen>2</ur_vlojen>
<pr>1</pr>
<cy>425</cy>
<vnesh_ssylok>4</vnesh_ssylok>
<id_donor>1234567</id_donor>
<status>OK</status>
<new_price>NO</new_price>
<pubDate>Sat, 15 Sep 2007 03:18:00 +0400</pubDate>
</item>
upyrj:
Кстати, есть еще вопрос, насколько это безопасно — именно в таком виде. 8/

Ну разве что изменить вид строки:

http://sape.ru/nic_name_system/export/0a8005f5594bd67041f88c6196192646.xml

Бутфорсить такой урл будет крайне неблагодарное занятие.

Егор:
Я так думаю, что 1K$ роли не сыграет, а домена уже не будет... это тоже вопрос :)
С другой стороны - что с ним дальше делать-то...

Кто знает, во сколько будут оценивать возраст домена и "чистую карму" завтра...

MoMM:
он: хочу купить
я: назовите разумную цену
он: ХХХХХ рублей

Обычно торг начинается с X XXX руб.

Судя по всему домен очень нужен и они знают больше чем все остальные.

Если не сейчас, то через год-два могут начать предлагать ХХХ ХХХ руб., вариантов не так много. Я бы не стал торопиться.

joost:
Что такое шингли? в Гугле. Если можно дайте пример. Форум читал.

Шинглы - алгоритм шинглов (shingles) - обнаружение нечетких копий и дубликатов текстов (шингл - чешуйка)

Илья Сегалович из Яндекса о шинглах (отрывок из статьи)

Для каждого десятисловия текста рассчитывается контрольная сумма (шингл). Десятисловия идут внахлест, с перекрытием, так, чтобы ни одно не пропало. А затем из всего множества контрольных сумм (очевидно, что их столько же, сколько слов в документе минус 9) отбираются только те, которые делятся на, скажем, 25. Поскольку значения контрольных сумм распределены равномерно, критерий выборки никак не привязан к особенностям текста. Ясно, что повтор даже одного десятисловия – весомый признак дублирования, если же их много, скажем, больше половины, то с определенной (несложно оценить вероятность) уверенностью можно утверждать: копия найдена! Ведь один совпавший шингл в выборке соответствует примерно 25 совпавшим десятисловиям в полном тексте!

Очевидно, что так можно определять процент перекрытия текстов, выявлять все его источники и т.п. Этот изящный алгоритм воплотил давнюю мечту доцентов: отныне мучительный вопрос «у кого студент списывал этот курсовик» можно считать решенным! Легко оценить долю плагиата в любой статье.
Всего: 2525