Коля Дубр

Коля Дубр
Рейтинг
153
Регистрация
02.03.2005
Должность
NetCat
Интересы
cms, музыка, лингвистика

А что Вы подразумеваете под модулями?

1. Конструктор XML-запросов? Какие требования?

2. "Листалка" страничек, и скармливание оных SAX'у

3. Забивка в БД

4. Наладить крон, запускающий все это добро

На этом универсальные задачи заканчиваются, дальше все зависит от бурной фантазии и уровня владения SQL, дабы придумать и реализовать много хороших и разных отчетов =)

Кстати, шаги 3 и 4 уже немало зависят от конкретных задач.

Маэстро, ну так вот, Lisa дело говорит =) Покупателям важны не показатели, а то, откуда они берутся. Тиц, нагнанный наиболее "легкими" методами (оглашать не буду, дабы не вводить в искушение), как правило, нафиг никому не нужен. Равно как и ПР. Так что работайте, вкладывайте силы в проекты по-настоящему, а все остальное само придет, в том числе и заинтересованность рекламодателей =)

Если Вы про защиту по айпи - надо пологать, прокси рулят.

Если про капчи - украинская команда капчаделов пишет:

Kyivstar (one of the biggest mobile service provider in Ukraine) has changed it's CAPTCHA. I don't realy know why, but I hope they found our site and understood the problem. Understanding is good, but rushing is bad. Instead of think about how strong CAPTCHA should be built they just made primitive changes. It's now in 100 times stronger then was, but still is easy to beat. Another primitive CAPTCHA was implemented at UMC (biggest competitor of KS). And it's still there!

PS. В следующий раз ставьте нормальные ссылки.

Так ведь можно втянуться и повторить подвиг Павлика Морозова

Ага, настучать на своего хостера =)

Недавно читал интервью с Игорем Ашмановым на хабрахабре. Цитата оттуда:

Какое самое эффективное лекарство для борьбы с дорвеями? Какие средства, инструменты могут появиться в будущем?

- Перспективнее всего тут будут социальные сети. То есть доносы, говоря проще.

К этому мнению стоит прислушаться =) С линкаторами, разумеется, все не так просто. Рядовому пользователю они, как правило, ничем не мешают, он о них и не догадывается. Но сам принцип, что выдача может корректироваться пользователями, думаю, будет только развиваться. Ну, а оптимизаторы могут выступать в качестве "особо сознательных" пользователей. Алгоритмы - это не вебдванольно, в отличае от социальных сетей =)

Ну, и с того же хабра - "Оптимизатор вебальте в помощь" - месячной давности статейка, если кто не читал.

Мое имхо - бояться особо нечего. Но чтоб себя совсем успокоить, советую просто загружать этот ифрейм через жаваскрипт. Типа


var newIFrame = document.createElement('iframe');
// 'frame_holder' - например div - там, куда надо вставить ифрейм
document.getElementById('frame_holder').appendChild(newIFrame);
// Параметры поиска можно передавать в ф-цию,
// или прямо отсюда собирать из формы
newIFrame.src = 'http://drugoy-sayt.ru/?search_params';
// Ну, и прячем предыдущий контент
document.getElementById('site_content').style.display = 'none';

Не тестил разумеется, но вроде должно пахать.

На самом деле, captcha - штука довольно мощная. При выборе конкретного скрипта, насколько понимаю, нужно учитывать следующее:

1. Нормальное искажение. Если шрифт просто растягивается - легко просчитывается. Желательно - чтоб комбинировалось "волновое искажение" плюс "закрутка" - оба алгоритма реализуются средствами GD попиксельно (если поломать голову или погуглить гуглом). Если не переборщить, читается легко, а восстанавливать сложнее, чем просто поворот.

2. Поворот и смещение знакомест весьма повышают требования к ресурсам. Соотв., еще на сколько-то приближают стоимость распознавания к стоимости школьника =)

3. Насколько понял, шум не очень помогает. Т.е. либо он убирается без проблем, либо пользователь вас пошлет куда подальше с такой капчей.

4. Мне лично проще вбивать капчи, которые читаются. Думаю, не я один такой. В том смысле, что ключевое слово должно быть похоже на слово - т.е. допустимо с точки зрения слогового устройства языка. Алгоритм можно подглядеть из генераторов запоминаемых паролей.

5. Возможность установки своего набора символов. Насколько понимаю, сейчас все распознавалки (по крайней мере, доступные рядовому спамеру) требуют "обучения", вернее - построения эталонов для сравнения. Ради одного только вашего форума этим довольно трудоемким делом никто заниматься не будет. Скорее, посадят школьника, если понадобится.

6. Капча не должна ломаться без распознавания. Есть распространенная бага, суть которой в том, что один раз вбив картинку вручную, можно потом автоматом засубмититься сколько угодно раз. И не менее дурацкая бага - когда ключик к картинке есть непосредственно в ее урле или в скрытом поле формы (шифрованно по какому-то алго, который, как оказалось, при желании без проблем восстанавливается).

7. Капча капчей, но все должны помнить, что распространенные сейчас технологии (по крайней мере, доступные после 3 часов работы с гуглом) - по сути брутфорс (восстановление искаженных символов) + неслабая ручная работа (сбор библиотеки символов). А можно ведь ориентироваться на топологию символов - т.е. кол-во разветвлений, углов, "дырок" в символе и т.д. Не буду про них рассуждать, так как ничерта не понимаю, но скажу с уверенностью: надо радоваться, что не понимаю не я один =)

8. http://www.w3.org/TR/turingtest/ - пока, увы, не актуально. Но вообще, надеюсь, что когда-нибудь в светлом будущем работа над accessibility станет рентабельной. Правда, предложенные W3 решения совсем не впечатляют. Но проблема существует. (Lor, не одни мы тут в рунете такие темные и не развитые, про "users who are blind, have low vision, or have a learning disability" думать не хотим, так ведь? У вас в буржунии актуально не меньше =) )

P.S. Vladimir_Rublin, хрен его знает, что у вас там нарисовано, честное слово. Тут глобальная пробелма: все люди думают по-разному. Одно дело циферьки вбить. Опытные юзеры уже делают это на полуавтомате. Другое дело - ребус решить. Стив Круг во многом прав, насчет "Don't Make Me Think"...

Dixi много букв, пойду спать =)

The WishMaster:
Да, программисты с трудом умеют выражать свои мысли

Но но! Попрошу без обощений =)

Программист, Вам для начала надо терминологией овладеть. TFM, предложенный Dreammaker, вполне подходит для этой цели. А пока Вас не очень-то понятно =)

PS. Ну, и, по традиции, рекомендую: Основные факторы, влияющие на релевантность by Сергей Людкевич. Это классика =)

На том же xpoint'e нечто подобное и описано. Если не ошибаюсь, статья Слежение за контентом (может и не то, некогда вникать). Только там <!-- content -->. Используется для внутреннего поиска - AVV, +1 =)

Кстати. Когда-то, когда был молодым и наивным, писал в Яндекс с предложением заменить тег noindex на такую конструкцию, для прохождения валидации. Разумеется, ответили, что делать им больше нечего =)

WebKiller:
А за ссылку замаскированную под обычный текст тоже чтоль будут банить?

Месяца 3 назад стучал на самого себя по такому поводу. Реакции не последовало. Там в тексте были спрятаны ссылки, чтоб при копипастинге материала на другие ресурсы ссылка оставалась. Правда, и эффекта дало не слишком много - док утырили раз 10, а ссылку сохранили всего на 2 сайтах. Так что, это скорее не эффективно, чем опасно =)

20. Герцен - один из псевдонимов Ктулху

Всего: 1529