Как сравнить 2 базы URL и почистить?

12
Б
На сайте с 07.07.2007
Offline
46
2648

Здравствуйте. Интересует сабж. Дано -

1. текстовый файл со всеми адресами URL.

2. текстовый файл с адресами из этой же базе, но которые "плохие"

нужно получить текстовый файл по принципу удалить все плохие из полного перечня и оставить "хорошие". Как это сделать?

Спасибо.

Watson
На сайте с 02.07.2007
Offline
111
#1

высылайте файлы в архиве на thinkit собачка mail.ru, верну почищенный за маленько wmz

Б
На сайте с 07.07.2007
Offline
46
#2

Дело не в деньгах, нужно самому научиться. Базы большие, много мусора десятки мегабайт, пересылать накладно.

anser06
На сайте с 11.03.2006
Offline
292
#3

Когда-то давно видел скрипт на javascript, который умел сравнивать списки адресов, но на списках в пару сотен URL уже ощутимо тормозил. Может быть, вам имеет смысл заказать что-то подобное у программеров.

LEOnidUKG
На сайте с 25.11.2006
Offline
1773
#4

Allsubmmiter, вам в помощь.

✅ Мой Телеграм канал по SEO, оптимизации сайтов и серверов: https://t.me/leonidukgLIVE ✅ Качественное и рабочее размещение SEO статей СНГ и Бурж: https://getmanylinks.ru/ ✅ Настройка и оптимизация серверов https://getmanyspeed.ru/
Б
На сайте с 07.07.2007
Offline
46
#5
LEOnidUKG:
Allsubmmiter, вам в помощь.

Пробовал, не помогает, у меня много адресов на одном домене, адреса разные, а аллсаб в черный список вносит только домен, но не адрес целиком.

Shtogrin
На сайте с 02.11.2006
Offline
95
#6

Бармалейкин, php скрипт подойдет?

www.shtogrin.com (http://www.shtogrin.com/). Канцтовары (http://www.invit.com.ua/). 1С Бухгалтерия (http://account.kiev.ua/).
Shtogrin
На сайте с 02.11.2006
Offline
95
#7

PHP5

all.txt - все

bad.txt - плохие

new.txt - новый файл, содержит уникальные строки из all.txt, которых нет в bad.txt

<?php

$a_all=array_unique(file('all.txt'));
$a_bad=array_unique(file('bad.txt'));
$a_new=array_diff($a_all,$a_bad);
file_put_contents('new.txt',implode("",$a_new));
?>

Проверяйте свои мегабайты, проще все файлы бросить в один каталог и оттуда запустить скрипт с командной строки. Будет быстро.

Shtogrin
На сайте с 02.11.2006
Offline
95
#8

Скрипт для удаления всех дубликатов строк из файла (по просьбе читателей).

PHP5

all.txt - все

new.txt - новый файл, содержит уникальные строки из all.txt

<?php
file_put_contents('new.txt',implode("",array_unique(file('all.txt'))));
?>

Извращенный вариант однострочной программы. Работает тоже быстро.

Onu
На сайте с 10.01.2007
Offline
170
Onu
#9

Я.Аналитик вам в помощь , пользуюсь им всегда для таких целей. И никаких php скриптов.

S
На сайте с 25.08.2006
Offline
51
#10

Shtogrin зачет ... я вот почемутобы такой скриптик растянулбы в раза 2 минимум :)

12

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий