ivan-lev

Рейтинг
435
Регистрация
20.04.2007

Минимальное количество символов, видимо, просчитывается до замены AAAA->A

2012-07-06%2011:50:59 - введён минимум 6, коммент "гы!!!" (5 символов) в результатах.

Если я правильно понял, замена АААА->А работает для 4-х и более _букв_. т.е. знаки восклицательные под эту замену не попадают. Имеет ли смысл рассматривать другие символы (точки-восклиательный/вопросительный знаки итд)

см 2012-07-06%2011:50:59 "ись!!!!"

Многострочные комментарии "склеиваются" (только при выводе?)

см там же "рулеткуyoutube", "oafnzвот" ...

Да.. и, возможно, для списка стоп слов пополнение найдётся.. Хотя, наверняка, каждый будет настраивать по своему усмотрению

- зайти по ssh и копировать с сервера, где лежат изображения (если, конечно, есть куда.. в смысле, внешний IP-шник, доступный с сервера)

- зайти по ssh и раскидать по каталогам с меньшим количеством файлов (к примеру, по 10к или по другим признакам).. например, по подмаске

mv 1*.* ../tempdir/*.*

Хотя, в таком случае и подмаска может вылететь из-за большого количества файлов - использовать xargs

> что бы не перегружать страницу при изменении месяца, и что бы запросы к базе можно было делать уже средствами php

Так уже подсказали

> через XMLHttpRequest

А вообще - гуглить ajax.. - много готовых библиотек есть.. В том же JQuery работа с ajax сделана довольно удобно (с точки зрения написания кода).

Если база пустая - значит не "встал". Не исключено, что "глюкнуло" разово - можно повторно попробовать поставить. Хотя, если установка говорит, что "нормально прошла".. странно.

Посмотрите php-ошибки в файле error.log

LEOnidUKG:
Насчёт комментария, который пропал. Скрипт просто резал многострочные и брал только первую строчку. Сейчас это исправлено.

_youtube.com/all_comments?v=MB21amtEWrE

2012-07-05%2017:10:48 - сюда не зацепился первый коммент (Stasambra 1 нед. назад), тоже, кстати, многострочный.. Хотя, может и не в этом причина.

LEOnidUKG:
Они находяться ЗА пределом 2-х страниц, а в демо версии там именно такое ограничение.

Вполне возможно - Вам виднее (хотя, на первой странице топика про 5 страниц написано)

Однако, следующий комментарий /см комментарий, содержащий "норм так)))" / попал в результаты парсинга.. (информация о результате парсинга в предыдущем сообщении). Оригинальные комментарии :

_youtube.com/all_comments?v=1SWrH4exaoU

А чуть ниже cACSoN1U_kw - количество комментариев на ролик явно больше двух страниц.

p.s. исключительно в качестве багрепорта.

У меня сайты сами "уходили" из статистики через некоторое время после съёма счётчика.. (последнего посещения?) Точно не скажу.. По ощущениям - срок около месяца-двух...

Поможет ли это улучшить "поведенческие факторы" для ГГЛ - не скажу..

Говно. Любой серверный парсер, возьмёт ЛЮБУЮ информацию с 1000 ваших страниц.

Да и не серверный тоже возьмёт..

LEOnidUKG:
Ой да ладно? Те кто читать не умеет?

Не-не.. чтобы менеджеры соседнего интернет-магазина описания товаров "не смогли скопировать"..

sg552:
Единственная нормальная защита от копирования - перегонять текст в картинки

Видимо, речь о защите от копирования выделить-копировать-вставить... :)

Естественно, просмотреть код в браузере или скачать файл на компьютер сможет любой более-менее технически подготовленный специалист.

2012-07-05%2006:52:24 -

Есть некоторые комментарии, которые не попадают в результат. Хотя, вроде, под фильтр не должны попадать. Например, коммент из первого (в отчёте 1SWrH4exaoU) видео с 84 лайками.

Быть может, имеет смысл добавить список стоп слов.. или (в перспективе?) даже нескольких заранее подготовленных списков с возможностью управления - [мат], [политика] и тд

У самих комментариев нет никаких id-шников? Возможно, будут полезны при добавлении новых комментариев к уже имеющимся (повторный парсинг)

Всего: 4907