Парсер комментариев с Youtube (Тестирование и продажа)

1 234 5
palladin_jedi
На сайте с 13.07.2010
Offline
71
#21
LEOnidUKG:
Если не затруднит, можно пример самого WP импорт

$xml .= "<wp:comment>\n";


$xml .= "<wp:comment_author><![CDATA[" . $author . "]]></wp:comment_author>\n";

$xml .= "<wp:comment_author_email>" . $author . "@hubpages.com</wp:comment_author_email>\n";

if ($link == null)
$xml .= "<wp:comment_author_url></wp:comment_author_url>\n";
else
$xml .= "<wp:comment_author_url>http://www.hubpages.com" . $link . "</wp:comment_author_url>\n";

$xml .= "<wp:comment_author_IP>" . $IP . "</wp:comment_author_IP>\n";
$xml .= "<wp:comment_date>" . $date . "</wp:comment_date>\n";
$xml .= "<wp:comment_date_gmt>" . get_gmt_from_date($date) . "</wp:comment_date_gmt>\n";
$xml .= "<wp:comment_content><![CDATA[" . $comment . "]]></wp:comment_content>\n";

if ($status == "Approved")
$xml .= "<wp:comment_approved>1</wp:comment_approved>\n";
else
$xml .= "<wp:comment_approved>0</wp:comment_approved>\n";

$xml .= "<wp:comment_type></wp:comment_type>\n";
$xml .= "<wp:comment_parent>0</wp:comment_parent>\n";
$xml .= "<wp:comment_user_id>0</wp:comment_user_id>\n";

$xml .= "</wp:comment>\n";

Источник.

Сайт о web-разработке и прочем (http://seazo.net)||Продвижение статьями под Google (http://short.seazo.net/ght4zf) Бесплатные консультации рефералам Sape (http://www.sape.ru/r.SWfwWOblBo.php) PHP и JS скрипты на заказ, создание сайтов с нуля и на CMS.
LEOnidUKG
На сайте с 25.11.2006
Offline
1774
#22

palladin_jedi, а там в самом WP выбирается к какому посту привязать эти комменты? В XML не вижу.

✅ Мой Телеграм канал по SEO, оптимизации сайтов и серверов: https://t.me/leonidukgLIVE ✅ Качественное и рабочее размещение SEO статей СНГ и Бурж: https://getmanylinks.ru/ ✅ Настройка и оптимизация серверов https://getmanyspeed.ru/
irisat
На сайте с 20.03.2012
Offline
197
#23
LEOnidUKG:
А вы какое слово то ввели? Может быть там мульён комментов

мавроди ))

Парсим: dnmgnDqKL9c

Найдено комментариев: 2546

Открыта страница 1

||||||||||

в настройке 10 комментов, русс, 20 символов...

LEOnidUKG:
Прямо с ютуба?

да.

вот сча снова на вскидку открыл http://www.youtube.com/watch?v=NU3UOZz-fxc

взял фразу "если в МТВ сидят не дураки, то они сделают Вэла своим лицом!"

клик: искать в гугл

первый в выдаче по фразе именно гугл - пробовал всего 3 фразы с разных страниц - все их гугл знает)

LocalBitcoins (https://goo.gl/1Yxi8M) | Бот обменник (https://goo.gl/bPTaiF) - Покупка и продажа bitcoins! Биржа криптовалют №1 (https://goo.gl/6r6icz) - более 350 пар!
LEOnidUKG
На сайте с 25.11.2006
Offline
1774
#24
мавроди ))
Парсим: dnmgnDqKL9c
Найдено комментариев: 2546
Открыта страница 1
||||||||||
в настройке 10 комментов, русс, 20 символов...

Это баг нового ядра, сейчас всё ок.

irisat:
да.
вот сча снова на вскидку открыл http://www.youtube.com/watch?v=NU3UOZz-fxc
взял фразу "если в МТВ сидят не дураки, то они сделают Вэла своим лицом!"
клик: искать в гугл
первый в выдаче по фразе именно гугл - пробовал всего 3 фразы с разных страниц - все их гугл знает)

http://www.youtube.com/watch?v=FuF-uy1HdOY&feature=related

http://www.google.ru/search?client=opera&rls=ru&q=%22%D0%90+%D0%B2%D1%8B+%D0%B8%D0%B4%D0%B8%D1%82%D0%B5!+%D0%B8%D0%B4%D0%B8%D1%82%D0%B5+%D0%B8+%D0%B2%D1%81%D1%82%D1%83%D0%BF%D0%B0%D0%B9%D1%82%D0%B5+%D0%B2+%D0%BC%D0%BC%D0%BC-2012+-+%D0%B2%D0%B0%D1%81+%D0%B5%D1%89%D0%B5+%D0%BD%D0%B5+%D1%81%D0%BE%D0%B2%D1%81%D0%B5%D0%BC+%D0%BE%D0%B1%D0%BE%D0%B1%D1%80%D0%B0%D0%BB%D0%B8+%D0%B2+%D0%BC%D0%BC%D0%BC-2011-+%D0%A2%D0%9E%D0%93%D0%94%D0%90+%D0%92%D0%9F%D0%95%D0%A0%D0%95%D0%94!%22&sourceid=opera&ie=utf-8&oe=utf-8

Поэтому кто как удачлив :)

---------- Добавлено 04.07.2012 в 22:54 ----------

Ну пока на данный момент:

[Исправлено] Не верно останавливался парсер

[Добавлено] Дизайн и логотип (официально бесплатный) :)

[Добавлено] Экспорт в DLE. Как через файл, так и на прямую в БД

irisat
На сайте с 20.03.2012
Offline
197
#25
LEOnidUKG:
Поэтому кто как удачлив

ага) точно) отрывал свежие результаты, думал что менее свежие точно в пролете)

Спасибо.

palladin_jedi
На сайте с 13.07.2010
Offline
71
#26
LEOnidUKG:
palladin_jedi, а там в самом WP выбирается к какому посту привязать эти комменты? В XML не вижу.

# Добавление комментариев

 INSERT INTO wp_comments (comment_author, comment_author_email, comment_author_url, comment_content, comment_date, comment_post_ID, comment_approved) SELECT a.name, a.email, a.website, a.body, a.publishDate, b.ID, '1' FROM old_comments_table a inner join wp_posts b on (a.postId = b.guid and a.approved = '1')

# Обновление

 UPDATE wp_posts wpp LEFT JOIN (SELECT comment_post_id AS c_post_id, count(*) AS cnt FROM wp_comments WHERE comment_approved = 1 GROUP BY comment_post_id) wpc ON wpp.id=wpc.c_post_id SET wpp.comment_count=wpc.cnt WHERE wpp.post_type IN ('post', 'page') AND (wpp.comment_count!=wpc.cnt OR (wpp.comment_count != 0 AND wpc.cnt IS NULL));

Раньше было так, по крайней мере. Может в новых версиях WP что-то и поменяли.

LEOnidUKG
На сайте с 25.11.2006
Offline
1774
#27
palladin_jedi:
# Добавление комментариев
 INSERT INTO wp_comments (comment_author, comment_author_email, comment_author_url, comment_content, comment_date, comment_post_ID, comment_approved) SELECT a.name, a.email, a.website, a.body, a.publishDate, b.ID, '1' FROM old_comments_table a inner join wp_posts b on (a.postId = b.guid and a.approved = '1')


# Обновление
 UPDATE wp_posts wpp LEFT JOIN (SELECT comment_post_id AS c_post_id, count(*) AS cnt FROM wp_comments WHERE comment_approved = 1 GROUP BY comment_post_id) wpc ON wpp.id=wpc.c_post_id SET wpp.comment_count=wpc.cnt WHERE wpp.post_type IN ('post', 'page') AND (wpp.comment_count!=wpc.cnt OR (wpp.comment_count != 0 AND wpc.cnt IS NULL));


Раньше было так, по крайней мере. Может в новых версиях WP что-то и поменяли.

Да сейчас там по другому. Поставил себе WP выдрал всё. Там теперь можно карму ставить постам. Я её привязал к лайкам.

Ну собственно для WP и DLE готовы экспорты. Хочу заметить, что есть возможность прямого экспорта прямо в таблицу этих CMS, минуя SQL файлы и ручную загрузку ☝

vlad00777
На сайте с 24.12.2009
Offline
119
#28

Попробовал. Сгенерировало, все окей, только верстка расползлась (Хром).

При длинных URL первая колонка сильно растягивается и ширина таблицы увеличивается с 780 до 830 пикселей.

Еще когда идет процесс парсинга, зачем вот эти штуки? "|" Их слишком много и они начинают вылазить за экран (появляется скролл, даже на разрешении 1920)

Видел вы писали,что нужно вставлять без "&feature=player_embedded", но люди не будут заходит на форум что бы это прочитать. Поэтому думаю нужно отсекать эту часть автоматом т.е то что после знака &.

А вобще думаю нужно убрать колонку URL.

А сделать что бы выводилось 1 раз перед таблицей, а в таблице уже сделать 3 колонки: Ник, комментарий, Лайк.

---------- Добавлено 04.07.2012 в 23:43 ----------

LEOnidUKG:
Хочу заметить, что есть возможность прямого экспорта прямо в таблицу этих CMS, минуя SQL файлы и ручную загрузку

Чесно говоря, так и не понял как это работает.

Отметил галочкой "напрямую" нажам экспорт. Высветилось "Экспорт в БД завершён!". А что, где?

Верстка. Качественно! Адаптивная, резиновая, с параллаксом и прочими плюшками. В ЛС.
LEOnidUKG
На сайте с 25.11.2006
Offline
1774
#29
Еще когда идет процесс парсинга, зачем вот эти штуки? "|"

1 палочка = 1 коммент :)

Это пока для теста, смотреть, что вообще делает скрипт.

Видел вы писали,что нужно вставлять без "&feature=player_embedded",

Уже всё поправлено.

А сделать что бы выводилось 1 раз перед таблицей, а в таблице уже сделать 3 колонки: Ник, комментарий, Лайк.

Сделано. Так же добавил, чтобы урл был ссылкой. Удобнее так сказать :)

vlad00777
На сайте с 24.12.2009
Offline
119
#30
На балансе antigate.com нет денег

Видать активно тестят форумчане :)

Не знаю насколько верно, но мне кажется, если на 1-ой странице нет комментариев, значит они закрыты и дальше парсить нет смысла, а у вас скрипт и дальше работает и естественно ничего не находит.

П.с кстати, когда комментариев нет, не пишет что их ноль, а просто:

"Найдено комментариев: "

И еще :)

Сейчас просматривая результаты парсинга.

И вижу что комментарии дублируются, причем какие по 2, какие по 7 раз. Делайте проверку на дубли.

Вот меня понесло :)

Еще бы каким-то образом отсеивать такие комментарии: "55555555555555555555555555555555555555555555555555". Вот например если больше 3-х одинаковых символов идет последовательно, то пропускать этот коммент. (в русском только слово: "длинношеее" имеет 3 одинаковых буквы подряд)

1 234 5

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий