Яндекс рассекретил покупателей секс-шопов

Н
На сайте с 15.06.2011
Offline
115
#781

pwd, сложность в том, что, в зависимости от того какие данные утекают, могут быть нарушены разные законы, а не только указанный вами. В общем случае схема нужна такая же, как и в оффлайне, где риски на "прокладках" остаются, но вы про нее и сами написали. То, что она не будет работать в описанном вами виде не значит, что не будет работать вообще. Однако, по сути сказать мне нечего.

На самом деле я нифига не понимаю как будут натягиваться существующие законы на онлайн и нифига не понимаю как строить схему (интим и роботс не предлагать, или хотя бы предлагать после предложения этого роботса Правительству РФ, Председателю Правительства РФ и далее по списку тех федеральных органов исполнительной власти у которых его нет).

ZeeRaN
На сайте с 16.05.2011
Offline
67
#782
<Георгий Лобушкин> В конце июля 2011 года люди ВНЕЗАПНО обнаружили, что поисковые машины индексируют страницы в интернете!

C баша)) в тему

SEO-услуги, качественно и недорого (/ru/forum/700348) Продвижение сайтов, составление СЯ (/ru/forum/comment/10999957), мелкие консультации - ICQ 621086068
Н
На сайте с 15.06.2011
Offline
115
#783

ZeeRaN, ага, смешно :)

А если чуть-чуть корректнее написать:

"В конце июля 2011 года люди ВНЕЗАПНО обнаружили, что поисковые машины индексируют их приватную переписку и заказы в секс-шопах",

то, вроде как, и не смешно.

Ну, то есть это мне не смешно. Насколько я понял для части рунета так даже смешнее...

Может просто у меня хреновое чувство юмора?

богоносец
На сайте с 30.01.2007
Offline
768
#784
Tarry:
Роботам срать на регистр в роботсе.

Другое дело, как настроен сервант, да. Чего там отдаётся на разный регистр тех же фолдеров на сервере.
burunduk:
запрос вида
url:site.ru/page.html
и
url:site.ru/Page.html
где site.ru/page.html

Это разговор о разном.

Делая запросы url:site.ru/Page.html | url:site.ru/page.html

проверяем только то, как ... обрабатываются запросы :)

и Яндекс, и Гугль не смотрят на регистр в запросе... хотя ссылка из выдачи — на урл с правильным регистром, иначе было бы 404.

Примера сейчас уже нет, но на регистрозависимом серваке две ПС проиндексили /Indexing-... когда в роботсе было Disallow: /index

но вот что-то ёкнуло, и решил уточнить урл в роботсе: Disallow /index.htm ... поэтому примера и нет уже. Но на регист в роботсе — роботам не срать... или не всегда.

Но все возможные случаи не проверялись. А надо бы. Или, на всякий случай, придерживайтесь одного регистра везде.

Ну и повторю один из вменяемых, и что самое приятное — тогда ещё уникальный, прошлогодний ответ ТП:

В настоящий момент из страниц, url которых различается только в регистре, в результатах поиска может участвовать только одна из этих страниц. C помощью файла sitemap можно повлиять на URL отображаемой страницы в результатах поиска, указав в нем адрес страницы в требуемом регистре.
С уважением, Платон Щукин

Но это уже не про обработку запроса с разным регистром. Вот и ломайте головы, а тут есть над чем. А ТП будет молчать...

КЭП
На сайте с 13.02.2011
Offline
80
#785

почему если в гугле набрать

site:fsb.ru секретно filetype:doc

то эти файлы можно скачать, а если набрать

site:fsb.ru секретно filetype:pdf (pdf - но :р показывает как смайлик :p)

идёт разрыв при закачке, это спец ограничение?

S
На сайте с 10.06.2009
Offline
52
#786
КЭП:
почему если в гугле набрать
site:fsb.ru секретно filetype:doc
то эти файлы можно скачать, а если набрать
site:fsb.ru секретно filetype:pdf (pdf - но :р показывает как смайлик :p)
идёт разрыв при закачке, это спец ограничение?

а Вы не пробовали восстановить загрузку при ошибке)) все нормально докачуеться.

С новой политикой Яндекса скоро делать СДЛ порталы будет не рентабельно, их займут разрекламированные Яндексом секшопы и мегафоны

[Удален]
#787
богоносец:
Делая запросы url:site.ru/Page.html | url:site.ru/page.html

я имел ввиду сделать их по отдельности, а результат будет одним и тем же - та страница которая реально существует

естественно сервер на не существующую страницу должен отдавать 404

например существующая страница (проиндексированна) www.allave.ru/polis.html

http://yandex.ru/yandsearch?text=url%3Awww.allave.ru%2Fpolis.html&lr=213

не существующая

http://www.allave.ru/Polis.html

а результат поиска по url

http://yandex.ru/yandsearch?text=url%3Awww.allave.ru%2FPolis.html&lr=213

тот же что и в первом случае

это о регистронезависимости поиска по url

теперь о роботсе

файл http://www.allave.ru/cod/diz.txt запрещён к индексации правилом

Disallow: /cod/

файл http://www.allave.ru/cod/Diz.txt также запрещён к индексации правилом

Disallow: /cod/

а вот файл http://www.allave.ru/Cod/diz.txt разрешён (его нет)

проверить можно тут

sabotage
На сайте с 14.02.2007
Offline
192
#788

Сегодня ночью совершенно случайно (подчеркиваю) наткнулся на очередные приватные данные' ~30k мыл с паролями.

Да только не людей, а ботов.

Пока разбирался что откуда, 8 утра наступило. Если вкратце:

2 персонажа предлагают 'раскрутку, продвижение вконтакте, твиттере, фэйсбуке'.

Основные услуги - набор ботов в группы. Реально наполняют хоть 50k за час.

Пробил по ним инфу. По одному настолько глубоко, что, при желании, можно лишить всех аккаунтов, почт и мыл ;)

Один с Питера, второй украинец. Обоим чуть больше 20.

Украинец клоновод страшный и страшно бестолковый. Такое впечатление, что он специально перелинковывает клонов аськами, почтами и скайпом. Только на серче 3-5 акков (банненые), на мауле штук 5 и все работают. Конечно же, всякие античаты, хакеры и контрастрайки.

Он, вроде как, на подсосе, типа реселлер питерского. В портфолио копирайтинг, взлом контакта, асек, мыл и скайпов (есть благодарные клиенты, инфа 100%), продажа скайпа с балансом и прочие мутные дела. Короче, чудо в перьях.

Второй чутка посерьезнее, офис есть, куча симок(большааая) и идей, что с ними делать. Вакансии программистов размещает, ТЗ на разработку софта пишет. Есть акк на серче, но молчит пока. На фрилансах, античатах и прочих услуги свои продает, причем успешно.

Сегодня решил пошерстить файлы получилась такая картинка:

В колонках Топ 30 сервисов и паролей. А вообще, 97% логинов/паролей нагенерированны, видно сразу (да и то, что на 38k логинов 36k пасвордов как бы намекает). В парочку залогинился, там только мессаджи с контакта. Но, в основном, не пускает.

Так о чем это я. О том, что бизнесмены эти, настолько криворукие, что гугл бегает по их горе-админке параллельно с ними и кнопки нажимает (там удалить, запустить - все ссылками). Вообще, админкой назвать язык не поворачивается, впечатление что позавчера скачали справочник по php и сразу в бой.

Берегите свои данные, какими бы они не оказались.

ps Скринов и явок насобирал 3 короба, но выкладывать не буду, не пишите. Ну, только если пару намеков, некоторым, в личке.

богоносец
На сайте с 30.01.2007
Offline
768
#789
burunduk:
я имел ввиду сделать их по отдельности

Да...

например существующая страница (проиндексированна) www.allave.ru/polis.html
http://yandex.ru/yandsearch?text=url...is.html&lr=213

не существующая
http://www.allave.ru/Polis.html
а результат поиска по url
http://yandex.ru/yandsearch?text=url...is.html&lr=213

тот же что и в первом случае

это о регистронезависимости поиска по url

Вот тут уже накладка может получаться.

Ну может сервак отдавать разные страницы при разном регистре после /

Если бы существовала страница /Polis.html , то ни один из запросов выше её не показал бы ... пока в индексе страница /polis.html

КЭП
На сайте с 13.02.2011
Offline
80
#790

Какое повальное увлечение сканирования ботами сайтов всех охватило

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий