borisd

Рейтинг
262
Регистрация
13.02.2008

Мда, я давно догадывался, что человечество, начиная с Адама, не эволюционирует, а деградирует... Вот то же самое и с поиском - что у гугла, что у яндекса. Если раньше я мог управлять поиском путем изменения формулировки запроса, то сейчас этого так просто не сделать - надо извращаться с кавычками и пр. Если раньше я сам был интеллектом, когда формулировал запрос, то сейчас поисковик заменил мой интеллект, мои профессиональные навыки и знания, своим искусственным интеллектом, обученным... кем??? - домохозяйками, разумеется. В итоге, на конкретный профессиональный вопрос я стал получать размытые нечеткие ответы общего зарактера. Если например меня интересует, какими именно шурупами лучше всего крепить пластиковый плинтус к стене, то поисковики сейчас мне выдадут обширное описание типов плинтусов, историческую справку, где купить и т.д и тп, но мне это не нужно, мне нужен краткий ответ типа: саморез с прессшайбой 4.2х35 и нейлоновый дюбель 6х30. Без воды. Также обнаружил проблему с поиском по фразам из логов. Раньше и гугл и яндекс на первые места ставили страницы с обсуждением ошибок, точно соответствующим логам. А с запуском семантического поиска и в гугле и в яндексе началась хрень - приходится использовать кавычки и язык запроса...

Да я и сам экспериментировал с семантическим поиском на корпусе в миллион документов, но в итоге отказался от него изза непрактичности. Да, результаты я получал интересные. Удивительно видеть в выдаче страницы, соответствующие в целом по смыслу, но в которых нет ни одного слрва из запроса... Однако я поймал себя на мысли, что что то мне в этих результатах не нравится и потом понял, что именно - результаты были тематически размыты, обобщенные, неконкретные, хоть и были в тему в большинстве своем. Т.е. практическая польза оказалась меньше, чем от классического поиска по словам...

А они еще нейронеую сеть прикрутили... А нейронеые сети отличаются тем недостатком, как непрозрачность их работы, то есть они по сути являются черным ящиком...

elitedesign:
Цель же: вывод списка с группировкой по браузерам.

1) Можно обойтись без группировки, достаточно сортировки по полю browser. На поле browser обязательно повесить индекс.

2) Поле browser заменить на browser_id, а browser - вынести в отдельную таблицу. При работе с миллионами записей это обязательно.

3) Тормоза после выполнения п.п. 1 и 2 возможно сохраняться, т.к. выборка у вас получается огромная - с миллионами записей, что требует много времени на передачу результата клиенту, а также сколько то гигабайт оперативки, в результате чего возможен своп с замедлением в сотню раз. Если вы еще весь этот результат в массив ПХП загоняете, то проблемы неудивительны.

Резюме: даже если оптимизируете по нормальному запрос, не надо весь огромный результат сразу из базы вытягивать, тягайте по крайней мере по одному браузеру за раз - всё равно ведь вы наверняка побраузерно обрабатывать данные будете.

Я не раз сталкивался с подобными проблемами больших выборок (32 Гига оперативы мне не хватало), поэтому в итоге в выборку в ключал только id и обработку вел поэлементно: намного лучше сделать миллион быстрых (по индексу) простых запросов к БД, чем за раз вытянуть несколько гигабайт данных и захлебнуться в них.

Как то тухло все. Уже неделя прошла после запуска проекта, а посещаемость даже до сотни не дошла. Кстати, хоть яндекс и позже начал обход, именно с него трафик пару дней назад начал капать..

West_90:
А как это оформить? Как в случае чего доказать кто за что отвечает? Кто до покупки, а кто после.

Договором, в котором четко прописывается что именно и на каких условиях вы приобретаете.

novis:
Зашибись...а какого вообще решили мой сайт в задания добавить? Итак трафик не растет никак, а тут еще этот бредовый сервис

Не волнуйтесь, никто в здравом уме не допустит прямого влияния асессорского сброда на сайты, да и на алгоритмы тоже.

Stan_1:
Попробую пояснить

У вас логика зациклена: то, что емэйл является ПД, вы доказываете, основываясь на том, что он - ПД.

Не надо домыслов при оперировании в правововом поле. Вы же сами привели цитату, что ПД это такие данные, по которым можно однозначно определить человека. Емэйл в общем случае к таким данным не относится. Но... проблема в том, что он в отдельных случаях может относится к ПД. Да и вообще абсолютно любые данные при определенных условиях могут являться ПД. Например, по фразе "лысый вождь мирового пролетариата" вы безошибочно узнаете, о ком речь. Таким образом под ПНД подпадает НИЧЕГО и ВСЁ одновременно... И в этом нет ничего удивительного, у нас почти все законы так сформулированы. Как это деление будет происходить на практике? Это также очень просто - по усмотрению должностного лица...

Stan_1:
или просто email - это уже персональные данные, поскольку email - индивидуален для человека.

Неужели? Т.е. зная email, можно сходу и точно сказать, кто именно за этим емэйлом скрывается? Поясните, как?

Яша вслед за гуглом наконец начал массовый обход (дней через 5). Кое что в индекс уже попало, но сидит в ТОП40, только пара-тройка запросов в ТОП5 попала. Тематика одна из самых конкурентных, поэтому пришлось с флангов заходить :)

ijjh:
Бюджет позволяет, не миллионы конечно, и есть программист, который напишет сайт наподобие этого за 50-100 тысяч (примерно

Это школьник, что для вас означает - деньги на ветер. Чтобы реально влезть в эту тему с новым и серьезным сайтом-сервисом бюджет нужен от 10 миллионов рублей и это как минимум.

То что вы хотите, не взлетит по определению и поэтому нет смысла выкидывать 100 тысяч. Впрочем, я раньше на телдери видел друпаловские сборки сайтов по недвижимости по 100 рублей. Лучше уж что то в этом роде тогда взять и поиграться.

outtime:
говорят, по 10 т.р. с одной фото отсуживают

Уточню: не просто 10 тысяч, а (цитирую) "в размере от десяти тысяч рублей до пяти миллионов рублей" (https://bazanpa.ru/gk4/razdel7/glava70/statya1301/).

Master of Magic, с фотками судпрактика уже накопилась обширная и в большинстве случаев положительная в пользу авторов. И некоторые, действительно, бизнес на этом делают. Поэтому вам надо определиться, что вы хотите - стричь бабло с этих компаний или просто убрать фотки. Если первый вариант, то надо сначала просчитать затраты и вероятные доходы и втихую грамотно подготовится (тут в обязательном порядке нужен смышленый юрист), а если второй вариант - то достаточно угроз, но... сейчас народ в конкурентных и денежных тематиках уж больно ушлый и наглый пошел и некоторые берега совсем потеряли - на таких угрозы не действуют.

Всего: 2244