Karl_ung

Рейтинг
61
Регистрация
09.07.2009
Pandabeer:
Прочитал этот закон, и сложилось мнение, что люди, писавшие его, с головой дружили очень плохо. Возникает много вопросов, что делать с контентом пользователей.
1) Вася указал в профиле при регистрации свои ФИО, теперь сайт занимается сбором и обработкой персональных данных ?
2) Петя закачал в качестве аватарки личное фото. Сайт занимается сбором и обработкой персональных данных ?
3) Анна закачала личное фото в свой фотоальбом. Сайт занимается сбором и обработкой персональных данных ?
4) Оля написала в блоге историю всей своей жизни, с перечнем всех фио, адресов, явок, паролей. Сайт занимается сбором и обработкой персональных данных ?
5) Допустим, в соглашении на использование сайта (оферте) указано, что пользователь отказывается от имущественных прав на закачиваемый контент в пользу владельцев сайта и делает контент публично доступным. Дает ли это юридическую отмазку на отказ, если пользователь вдруг говорит, "убирайте мое фото" а это фото уже глубоко интегрировано в разных местах сайта ? В законе сказано, что разрешение на обработку личных данных может быть отозвано субьектом данных, кроме того, под публично доступными данными понимается какая то очередная бредовая формулировка.
Даже если соглашение (оферта) на сайте присутствует, в законе сказано, что разрешение на обработку личных данных дается в письменной форме. Для интернет-сайтов это - бред, думаю все согласятся.

Хотелось бы выслушать авторитетное мнение, желательно юриста, по теме.

1. Нет, ФИО не позволяет идентифицировать личность, но ФИО + ИП из лога уже может, поэтому все таки да:)

2. Нет, петя по собственной воле сделал информацию общедоступной, у вас есть доказательства(логи)

3. Тоже, что и пункт 2

4. Все что касается Оли в соответствии с п.2, если Оля публикует инфо о других лицах то Оля и сам сайт занимаются обработкой ПДн.

5. В оферте необходимо требовать "согласие пользователя на обработку персональных данных" - именно в этой формулировке, этого достаточно, в любом случае право на прекращение обработки ПДн у пользователя остается, но воспользоваться но может только если докажет что это его учетная запись, то есть у автора сайта есть право требовать подтверждение личности.

Для интернет сайтов это не бред, функцию удаления данных о пользователе по запросу достаточно не сложно реализовать.

Вообще не так все и страшно, проблема в том что считать ПДн, тут много различных толков, даже проверяющие на этот вопрос не могут однозначно ответить, но думаю скоро все утрясется.

Karl_ung добавил 11.11.2009 в 18:29

DmitrySeneshal:

вообще вопрос о персональных данных очень темный.
законодатели в этом вопросе по степени идиотизма превзошли самих себя. с нового года вводится обязательная сертификация всех, кто занимается работой с персональными данными (ОЧЕНЬ многие сайты). и даже установили ответственность за нарушение (Статья 13.11. КОАП). но кто из госорганов может проводить сертификацию - не установлено. т.е. с нового года можно натягивать по полной любой сайт.

Вообще то для этого даже этот орган создали :).

Сайт натянуть нельзя, можно только владельцев, и не любой, а на котором есть ПДн, так что паги о Кактусах с форумом, в которых надо регистрироваться только по нику ни кто не тронет.

В первую очередь конечно внимание обратят на соц. сети, но особо крупные подстраховались, и привели в соответствие свои ИСПДн, закон то с 2007 года еще, так что эта новость не для всех была новой.

томаз:


деза

пруф .

Karl_ung добавил 10.11.2009 в 10:57

томаз:
"считает слова в документе и сравнивает"

это приметив.

сравнивается СМЫСЛ.

а смысл, это содержание в форме...

звездная карта...

с дырочками такая, как в кин-дза-дза, че то там в центуре...

Джордж Зипф доказал обратное.

За поисковики не скажу, но урл читается тяжелее когда в качестве разделителя используются точки, меж буквенное расстояние маленькое.

Dobrodoov:

Посещаемость: 130 хостов.
Доход: 90-110$/м (adsense)

Не верю.

.

Так опубликован же алгоритм был яндексом, конечно часть поменялась но суть осталась той же.

Берется каталог(ЯК), разбивается на слова, высчитывается частота для каждого слова(словоформы не учитываются), далее берется тема опять же из ЯК, высчитывается частота слов в теме, потом высчитываются две вероятности:

1. Вероятность того что если встретилось слово то документ в теме

2. Вероятность того что если слово встретилось то документ не в теме

Далее анализируется текст тематику которого надо определить, и находятся темы близкие этому документу.

При фасетной организации эталонного каталога, тема более менее ярко выражена.

У страниц nic.ru которая предназначена для парковки просроченных доменов, стоит в robots.txt запрет на индексацию поисковиками, поэтому и было все удалено из индекса.

А ждать теперь придется как всем новым сайтам, в течении пары недель залезет в индекс.

falkhan:

Сделаете - http://www.cultseo.ru/seo/algoritm-generacii-dorveya/ и будет вам счастье

Что то подобное делал только не для доров, а для ГС для продажи ссылочного, там как раз делал обратную оптимизацию, чтобы трафика мало шло(меньше нагрузки на хостинг, меньше вероятность стука).

Немного только другая концепция была:

1. Союзы знаки пунктуации не мусор, а важный связующий член предложения.

2. С определением глаголов проблем не было, в словаре Зализняка все есть, сложнее с существительными например с географическими названиями. К тому-же предложения может быть и без подлежащего или сказуемого, или без обоих.

3. Блоки выбирал исходя из верстки и знаков препинания, например </p>, </br> и т.д. обрывают предложения. Удалялся мусор в виде меню, и постоянно присутствующих блоков.

4. Делается максимально возможный разбор предложения(до конца так пока и не удалось сделать, велик и могуч Русский язык), выявляются согласования частей предложения, например дом может быть у дороги, но не может быть в океане, все найденный части удаляются.

5. Кусок предложения который остался после п.4 дополнятся по алгоритму обратному п.4

6. ????????.

7. Profit.

сначала проверяет на доступность потом на бан, так что "Сервер недоступен, либо возвращает код статуса http, отличный от 200" - не говорит ни о чем.

Не будет ни какого конфликта при параллельном чтении, да и при незначительном телодвижении эта проблема снимается и для записи.

Всего: 140