Мда, я давно догадывался, что человечество, начиная с Адама, не эволюционирует, а деградирует... Вот то же самое и с поиском - что у гугла, что у яндекса. Если раньше я мог управлять поиском путем изменения формулировки запроса, то сейчас этого так просто не сделать - надо извращаться с кавычками и пр. Если раньше я сам был интеллектом, когда формулировал запрос, то сейчас поисковик заменил мой интеллект, мои профессиональные навыки и знания, своим искусственным интеллектом, обученным... кем??? - домохозяйками, разумеется. В итоге, на конкретный профессиональный вопрос я стал получать размытые нечеткие ответы общего зарактера. Если например меня интересует, какими именно шурупами лучше всего крепить пластиковый плинтус к стене, то поисковики сейчас мне выдадут обширное описание типов плинтусов, историческую справку, где купить и т.д и тп, но мне это не нужно, мне нужен краткий ответ типа: саморез с прессшайбой 4.2х35 и нейлоновый дюбель 6х30. Без воды. Также обнаружил проблему с поиском по фразам из логов. Раньше и гугл и яндекс на первые места ставили страницы с обсуждением ошибок, точно соответствующим логам. А с запуском семантического поиска и в гугле и в яндексе началась хрень - приходится использовать кавычки и язык запроса...
Да я и сам экспериментировал с семантическим поиском на корпусе в миллион документов, но в итоге отказался от него изза непрактичности. Да, результаты я получал интересные. Удивительно видеть в выдаче страницы, соответствующие в целом по смыслу, но в которых нет ни одного слрва из запроса... Однако я поймал себя на мысли, что что то мне в этих результатах не нравится и потом понял, что именно - результаты были тематически размыты, обобщенные, неконкретные, хоть и были в тему в большинстве своем. Т.е. практическая польза оказалась меньше, чем от классического поиска по словам...
А они еще нейронеую сеть прикрутили... А нейронеые сети отличаются тем недостатком, как непрозрачность их работы, то есть они по сути являются черным ящиком...
1) Можно обойтись без группировки, достаточно сортировки по полю browser. На поле browser обязательно повесить индекс.
2) Поле browser заменить на browser_id, а browser - вынести в отдельную таблицу. При работе с миллионами записей это обязательно.
3) Тормоза после выполнения п.п. 1 и 2 возможно сохраняться, т.к. выборка у вас получается огромная - с миллионами записей, что требует много времени на передачу результата клиенту, а также сколько то гигабайт оперативки, в результате чего возможен своп с замедлением в сотню раз. Если вы еще весь этот результат в массив ПХП загоняете, то проблемы неудивительны.
Резюме: даже если оптимизируете по нормальному запрос, не надо весь огромный результат сразу из базы вытягивать, тягайте по крайней мере по одному браузеру за раз - всё равно ведь вы наверняка побраузерно обрабатывать данные будете.
Я не раз сталкивался с подобными проблемами больших выборок (32 Гига оперативы мне не хватало), поэтому в итоге в выборку в ключал только id и обработку вел поэлементно: намного лучше сделать миллион быстрых (по индексу) простых запросов к БД, чем за раз вытянуть несколько гигабайт данных и захлебнуться в них.
Как то тухло все. Уже неделя прошла после запуска проекта, а посещаемость даже до сотни не дошла. Кстати, хоть яндекс и позже начал обход, именно с него трафик пару дней назад начал капать..
Договором, в котором четко прописывается что именно и на каких условиях вы приобретаете.
Не волнуйтесь, никто в здравом уме не допустит прямого влияния асессорского сброда на сайты, да и на алгоритмы тоже.
У вас логика зациклена: то, что емэйл является ПД, вы доказываете, основываясь на том, что он - ПД.
Не надо домыслов при оперировании в правововом поле. Вы же сами привели цитату, что ПД это такие данные, по которым можно однозначно определить человека. Емэйл в общем случае к таким данным не относится. Но... проблема в том, что он в отдельных случаях может относится к ПД. Да и вообще абсолютно любые данные при определенных условиях могут являться ПД. Например, по фразе "лысый вождь мирового пролетариата" вы безошибочно узнаете, о ком речь. Таким образом под ПНД подпадает НИЧЕГО и ВСЁ одновременно... И в этом нет ничего удивительного, у нас почти все законы так сформулированы. Как это деление будет происходить на практике? Это также очень просто - по усмотрению должностного лица...
Неужели? Т.е. зная email, можно сходу и точно сказать, кто именно за этим емэйлом скрывается? Поясните, как?
Яша вслед за гуглом наконец начал массовый обход (дней через 5). Кое что в индекс уже попало, но сидит в ТОП40, только пара-тройка запросов в ТОП5 попала. Тематика одна из самых конкурентных, поэтому пришлось с флангов заходить :)
Это школьник, что для вас означает - деньги на ветер. Чтобы реально влезть в эту тему с новым и серьезным сайтом-сервисом бюджет нужен от 10 миллионов рублей и это как минимум.
То что вы хотите, не взлетит по определению и поэтому нет смысла выкидывать 100 тысяч. Впрочем, я раньше на телдери видел друпаловские сборки сайтов по недвижимости по 100 рублей. Лучше уж что то в этом роде тогда взять и поиграться.
Уточню: не просто 10 тысяч, а (цитирую) "в размере от десяти тысяч рублей до пяти миллионов рублей" (https://bazanpa.ru/gk4/razdel7/glava70/statya1301/).
Master of Magic, с фотками судпрактика уже накопилась обширная и в большинстве случаев положительная в пользу авторов. И некоторые, действительно, бизнес на этом делают. Поэтому вам надо определиться, что вы хотите - стричь бабло с этих компаний или просто убрать фотки. Если первый вариант, то надо сначала просчитать затраты и вероятные доходы и втихую грамотно подготовится (тут в обязательном порядке нужен смышленый юрист), а если второй вариант - то достаточно угроз, но... сейчас народ в конкурентных и денежных тематиках уж больно ушлый и наглый пошел и некоторые берега совсем потеряли - на таких угрозы не действуют.