- Поисковые системы
- Практика оптимизации
- Трафик для сайтов
- Монетизация сайтов
- Сайтостроение
- Социальный Маркетинг
- Общение профессионалов
- Биржа и продажа
- Финансовые объявления
- Работа на постоянной основе
- Сайты - покупка, продажа
- Соцсети: страницы, группы, приложения
- Сайты без доменов
- Трафик, тизерная и баннерная реклама
- Продажа, оценка, регистрация доменов
- Ссылки - обмен, покупка, продажа
- Программы и скрипты
- Размещение статей
- Инфопродукты
- Прочие цифровые товары
- Работа и услуги для вебмастера
- Оптимизация, продвижение и аудит
- Ведение рекламных кампаний
- Услуги в области SMM
- Программирование
- Администрирование серверов и сайтов
- Прокси, ВПН, анонимайзеры, IP
- Платное обучение, вебинары
- Регистрация в каталогах
- Копирайтинг, переводы
- Дизайн
- Usability: консультации и аудит
- Изготовление сайтов
- Наполнение сайтов
- Прочие услуги
- Не про работу
Зачем быть уникальным в мире, где все можно скопировать
Почему так важна уникальность текста и как она влияет на SEO
Ingate Organic
В 2023 году Одноклассники пресекли более 9 млн подозрительных входов в учетные записи
И выявили более 7 млн подозрительных пользователей
Оксана Мамчуева
Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий
firacet, скрипт писался для себя, под собственные нужды, это пока не скрипт парсера как поисковая технология гугл или яндекс и потому учитывало интересы только 2 человек, а не миллионов...
А вообще мы от темы топика отдалились, не стоит уделять так много внимания моей персоне, подскажите лучше ТС чтонибудь ;)
Гм.. С каких пор мускул стал она? И вообще что за бред вы несете насчетплохих результатов работы мускула? Может вы дефолтный конфиг юзаете? Или на дешевом впсе с 256 метрами подняли свой мускул? Уверен что мускул работает на порядок быстрее и надежнее вашей самописаной БД. Так как над мускулом работает не один "гений самоучка" ;)
Еще могу посоветовать Вам почитать мануал мускула на тему ключиков ;) И тогда даже Ваши сверх сложные "фильтрации названий отпарсенных статей" будут фильтроваться очень хорошо ☝
Поищите в гугле
Tune mysql и тогда поймете как должен _нормально_ работать сервер баз данных.
p.s. Просто смешно читать такие посты - всемирно известный продукт который используют в своих проектах множество огромных компаний - уйня! Использую свой написанный на коленке ;)
Чао.
В том то и дело что самоучки, школьники и студенты ))
Почитайте:
http://alexf.name/2008-07-28/eshhyo-pro-mysql/
А действительно серьезные компании юзают Oracle ;) Вы может еще думаете в Яндексе мускуль стоит ? 😆
firacet
о всезнающий салобон, расскажите нам пожалуйста, как таки делать деньги?
Вы не правы, я совсем не всезнающий. Просто приходилось работать с базами данных довольно большого обьема под сильной нагрузкой ( писал софт под VoIP - софтсвич )
А по теме: Всегда писал парсер под каждый сайт, не знаю чего так - как-то все руки не доходили сделать универсальный парсер по шаблонам. Ленивый я ;) Кстати есть небольшая коллекция парсеров статеек - если они еще работают могу вам подкинуть.
П.С, Простите за агрессивный тон в предыдущем посте. Что-то на меня нашло - наверное последствия солн. затмения.
А чего тема в дорвееводстве-то?
Если ТС сплог хочет - то этого валом и читабильность там совершенно не обязательна.
Если нужна читабельность и красиво выдранные статьи , то это не в дорвееводство писать надо :). Тогда лучше почитать про регулярки.
Если нужна читабельность и красиво выдранные статьи , то это не в дорвееводство писать надо :). Тогда лучше почитать про регулярки.
Какая разница регулярки/не регулярки? Можете хоть стандартными функциями обработки строк парсить. Главное алгоритм пока толковый не спалили. А по шаблонам - это не совсем авто:o Хотя функционал у парсера VipRaskrutka приятный :)
А я вместо регулярок часто explode'ом вырезаю нудный кусок
$t = explode('начало',$t);
$t = $t[1];
$t = explode('конец',$t);
$t = $t[0];
;)
я регулярками фигачу
30 сайтов генерится чуть более часа в каждом всего около 10 статей
главное чтоб пс их заглатывали и не давились :)
Какая разница регулярки/не регулярки? Можете хоть стандартными функциями обработки строк парсить. Главное алгоритм пока толковый не спалили. А по шаблонам - это не совсем авто:o Хотя функционал у парсера VipRaskrutka приятный :)
Разница есть. Особенно когда есть гора неуникальных элементов и будет гора уникальных, значение которых мы предсказать не можем.
Впрочем мой пост сводился больше к тому, что если нужен чистенький текст - то нужно затачивать под конкретный сайт/сайты - не будут универсальные решения красиво работать.
По поводу алгоритма толкового под универсальный парсер - я уверен что даже если его спалят, то ТС просто не сможет его реализовать.
универсальный парсер с текстовым конфигом написать не сложно. вот облечь это все в грамотный, удобный и эффективный гуй - вот это реально гемор. Но если вы сделаете подобную вещь, очень немногие решат выложить тулзу в паблик, пусть и за деньги.
если задача - собрать статьи, чтобы использовать их именно как статьи, а не набивка для доров, то полный автомат никак невозможен... лучше потратить минуту на составление регэкспа и в результате иметь базу статей, чем собрать кучу говна на автопилоте, тем более поиск источников статей на автомат тоже особо не поставишь