Словодёр — эффективный парсер поисковых подсказок

asto
На сайте с 13.10.2005
Offline
180
#41

Преподов по программированию, к сожалению, мало хороших. У нас вот при желании можно было выучить нормально Delphi, Perl и Javascript, а на 5 курсе поработать с ASP.NET. Оно само собой, от написания мега-софта, который при нажатии циферки от 1 до 1000 будет генерировать, удовольствия никакого не будет))) MIND, Вы только с десктопный софт пишите или на php тоже?

[Удален]
#42

MIND, как оказалось кодировка очень важна. Больше месяца убила на дорген. Все работает, google доволный, ну не банит смысли, трафик идет. Решили подключать национальные поисковики, сайты. И сюрприз. Франзузский и другие языки со спец. символами хранятся в Unicode. А delphi по умолчанию unicode не понимает, и чтобы его научить нужно искать компоненты. На форумах пишут, что они существуют) Но, в моем случае, нужно учить юникоду еще подключенные библиотеки с регуляркой и ассоциативными массивами, и подозреваю компоненты работы с вебом тоже не понимают Unicode.

В институте целый семестр кодила в С++ на MFC. Мне не понравилось. Хотя, это объяснимо. Там кнопочки некрасивенькие) Собственно это было решающим в выборе любимого языка.

2-й день уже изучаю c#))). В нем тип char именно в unicode, т.е. символ весит 16 байт, а не 8. Ну и расчитываю повысить скорость работы программы в будущем.

spambot
На сайте с 12.12.2008
Offline
55
#43
miachka:
MIND, как оказалось кодировка очень важна. Больше месяца убила на дорген. Все работает, google доволный, ну не банит смысли, трафик идет. Решили подключать национальные поисковики, сайты. И сюрприз. Франзузский и другие языки со спец. символами хранятся в Unicode. А delphi по умолчанию unicode не понимает, и чтобы его научить нужно искать компоненты. На форумах пишут, что они существуют) Но, в моем случае, нужно учить юникоду еще подключенные библиотеки с регуляркой и ассоциативными массивами, и подозреваю компоненты работы с вебом тоже не понимают Unicode.

В институте целый семестр кодила в С++ на MFC. Мне не понравилось. Хотя, это объяснимо. Там кнопочки некрасивенькие) Собственно это было решающим в выборе любимого языка.

2-й день уже изучаю c#))). В нем тип char именно в unicode, т.е. символ весит 16 байт, а не 8. Ну и расчитываю повысить скорость работы программы в будущем.

вам не компоненты искать надо, а почитать нормальные описания по работе с ансистрокой и как, и почему она отличается от юникодной строки, вы даже в терминологии путаетесь 16 байт весит char - OMG новый стандарт UTF128?

поднимайте базу знаний, алгоритмов - если у вас в дельфи тормозит все - дотнет не совершит чудес.

Every time you attempt to parse HTML with regular expressions, the unholy child weeps the blood of virgins, and Russian hackers pwn your webapp. (http://stackoverflow.com/questions/1732348/regex-match-open-tags-except-xhtml-self-contained-tags/1732454#1732454)
-=Spirit=-
На сайте с 03.02.2008
Offline
144
#44

Только у меня при парсинге Яндекса вылетает ошибка?

Невозможно разрешить удаленное имя: 'suggest.yandex.ru'
✔ Разработка и доработка сайтов на любых CMS, самописные решения. Опыт более 5 лет. (/ru/forum/863452)
spambot
На сайте с 12.12.2008
Offline
55
#45
-=Spirit=-:
Только у меня при парсинге Яндекса вылетает ошибка?

:) а вот и реакция ПС - статистику мейл ру тоже мучали все кому не лень в итоге лавочка была прикрыта.

MIND
На сайте с 08.03.2007
Offline
238
#46

У меня пока работает еще :).

Key Collector - автоматизированная система анализа семантического ядра (/ru/forum/863504)
-=Spirit=-
На сайте с 03.02.2008
Offline
144
#47
MIND:
У меня пока работает еще :).

Да, ошибкочка вышла, сорри. Фаерволл случайно побанил. Все работает :)

Илья
На сайте с 22.08.2006
Offline
75
#48

Отличный парсер, спасибо!

Отписался на сайтике, здесь тоже напишу: выдирал бы он ещё слова до ключевика, с заданной глубиной (т.е. расстоянием до ключевика) — я бы даже закинул на вебмани какую-нибудь циферку в благодарность. :)

RedHead
На сайте с 14.03.2008
Offline
44
#49

кто парсит много, подскажите какой таймаут выставляете, или дефолтный юзаете? :)

MyOST
На сайте с 22.01.2006
Offline
559
#50

RedHead, 150-200, если на ночь оставляю

Правда гугл через часок все-равно отдаст 502

Блог (http://seom.info/) | Ты уже SEO профессионал? (http://www.key-collector.ru/) Развиваем семантику более 8 лет! ()

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий