- Поисковые системы
- Практика оптимизации
- Трафик для сайтов
- Монетизация сайтов
- Сайтостроение
- Социальный Маркетинг
- Общение профессионалов
- Биржа и продажа
- Финансовые объявления
- Работа на постоянной основе
- Сайты - покупка, продажа
- Соцсети: страницы, группы, приложения
- Сайты без доменов
- Трафик, тизерная и баннерная реклама
- Продажа, оценка, регистрация доменов
- Ссылки - обмен, покупка, продажа
- Программы и скрипты
- Размещение статей
- Инфопродукты
- Прочие цифровые товары
- Работа и услуги для вебмастера
- Оптимизация, продвижение и аудит
- Ведение рекламных кампаний
- Услуги в области SMM
- Программирование
- Администрирование серверов и сайтов
- Прокси, ВПН, анонимайзеры, IP
- Платное обучение, вебинары
- Регистрация в каталогах
- Копирайтинг, переводы
- Дизайн
- Usability: консультации и аудит
- Изготовление сайтов
- Наполнение сайтов
- Прочие услуги
- Не про работу

В 2023 году Одноклассники пресекли более 9 млн подозрительных входов в учетные записи
И выявили более 7 млн подозрительных пользователей
Оксана Мамчуева
Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий
Всё правильно. именно про это я и спрашиваю.
про список доменов:
Я думал, что натравлю на скрипт пару сайтов - они дадут внешние ссылки и их будет становиться всё больше и больше. Но так не произошло. На уровне 400 ссылок - ссылки практически перестали рости.
Но сейчас я просто беру домены из словаря. - От сюда появился скрипт на проверку домена.
Нашёл кучу свободных доменов-слов.
Необходимый минимум:
1) одна хэш-таблица
2) одна очередь
Сканируете сайт, и ищите все ссылки, для этого парсите DOM. Все ссылки (относительные и абсолютные) приводите к одному виду
[protocol][host][path][query][fragment]
вот так:
https://
searchengines.guru
/showthread.php
?p=15258626
#post15258626
После этого все ссылки нужно добавить в очередь. Очередь, кстати, желательно ограничить по длине (на 1024 элемента к примеру) так как смысла от слишком большой очереди нет. Каждый раз при обнаружении ссылки топаем в хэш-таблицу и смотрим, есть ли такой ключ, и каково его значение (может быть false или error если вдруг сайт не ответил). Если ключа нету или значение false, значит добавляем в очередь на посещение. Если ключ есть, и его значение true, тогда выбрасываем данную ссылку так как мы уже ходили по ней.
Как-то так. Это без индексирования текста и базы входящих исходящих ссылок.
danforth, а на Друпал есть готовое решение?
1. Где взять список доменов в свободном доступе?
парсим базу сайтов с яндекс каталога, там больше 30 тысяч сайтов
+ сайты по идеи должны быть адекватными, без тысяч гс
+ этого объема хватит на понимание, что ничего не выйдет и успешно забить на эту глупую затею ☝
Парсить Хуи
Да вы батенька шалун. :))))
---------- Добавлено 21.09.2017 в 20:35 ----------
Кто нибудь покажите Милторгу сегодняшнюю дату, а то он походу думает, что сейчас весна 98 года.
Предлагаю начать с каталога сайтов
Предлагаю начать с каталога сайтов
Я сейчас это и делаю. Каталог доменов. Беру слова из словаря. Прогоняю через проверку.
Нашёл кучу привлекательных однословных доменов. Что с ними делать - пока не понятно.
---------- Добавлено 22.09.2017 в 14:21 ----------
Ну и попутно формеруется список существующих доменов - и что с ним делать - тоже пока не ясно.
---------- Добавлено 22.09.2017 в 14:25 ----------
Тут мне дали список сайтов и предложили парсить его - добывать емейл. А публикование списка емэйл - это законно?
В преддверии алковыходных хочу довести до "мастеров художественного глума", что здесь не Курилка, и, если они этого еще не поняли в упоении стадного инстинкта преследования изгоя, то теперь за флуд они начнут получать реальные штрафы.
wolf, а софт, проверяющий словарь по "who is"-сервисам - точно "поисковик"?
Miltorg, ты молодец, что поисковик делаешь.
Удобный поисковик нужен всем.
Раблер не смог конкуренцию яндексу сделать.
У тебя же получится!!!!
Расскажи подробнее как он будет работать.
В какой базе данных будет хранить информацию?
Структуру базы данных уже разработал?
Покажи схему базы данных.
miltorg, Обычный поисковик всякий может сделать. Сделай поисковик по исходному коду, типа Publicwww.