$resu = mysql_query("INSERT INTO page (`title`,`text`) VALUES (\"".$title_p."\",\"".$text_p."\")");
Не плохо было бы еще и mysql_real_escape($title_p/$text_p) сделать, дабы предотвратить возможность SQL Injection.
Прошу прощения за долгий ответ.
Сама база без морфологии не очень нужна. Т.к. в базе хранятся слова\словосочетания в базовых формах.
- Использовался весь ЯК. (годичной, пожалуй, давности - в скором времени запущу перепарсинг).
- сложно сказать... это не так просто посчитать :) парных словосочетаний (по два слова) - 11млн.
вот для примера
Бизнес > Финансы > Налоги:
бухгалтерский услуга
юридический услуга
бухгалтерский учет
бухгалтерский обслуживание
налог на
юридический лицо
Учеба > Курсы > Иностранные языки:
английский язык
курс английский
иностранный язык
язык в
изучение английский
за рубеж
Бизнес > Строительство > Дачи и коттеджи:
деревянный дома
дома из
деревянный домовый
клееный брус
из брус
строительство деревянный
Частоты слов\словосочетаний, веса слов\словосочетаний на странице, базовые формы слов.
Я отчасти из-за этого сюда и написал - чтобы узнать требования к данному продукту (к скорости работы, к уровню качества определения тематики и т.д.).
Доказывать качество буду позже, когда будет понятно что именно требуется.
Спасибо за конструктив :)
PS. Залил правильную базу (старая не поддерживала морфологию).
PS2. Не пишите сюда о том, что при вводе урла не с русским содержанием - выводятся непонятные категории. Так и должно быть :) Язык пока - только русский.
HapKOTuK добавил 18.11.2010 в 00:29
Это конечно же учитывается. Но только по ним - нельзя.
Прошу прощения - нашел багу - залил не ту базу :)
Сейчас заливаю другую. Минут через 30 зальётся.
Так посоветуйте куда переместить :)
Я так и не смог куда его вернее всего стоит поместить. Так что был тут изначально.
Да, такое бывает.
На сколько показал мой опыт тестирования - подобное происходит при малом количестве текста на сайте.
Плюс я сейчас заметил, что на демке использовались не те настройки весов.
Попробуйте еще раз.
И если не сложно, напишите адрес сайта. Можно в личку, чтобы не захламлять форум лишними сообщениями - посмотрю что такое с ним.
У людей, которые отмечают видимость, проблемы с определением дистанции и чего с этим делать - увы, так и не придумал.
В любом случае, на мой взгляд, важна информация есть или нет дым в каком-то месте. Количество дыма - уже не так важно.
Если бы люди отмечали не только "есть дым", но и отсутствие его - было бы лучше. Но такова человеческая психология.
Я её сделал на коленке за несколько часов.
На удивление пошла. Когда в Москве дым - 10-12 тысяч приходит.
Посоветуйте как улучшить?
PS. Пока не ввёл капчу было http://www.smokeinfo.ru/index2.html :)) (там над штатами НЛО, с югозападе от москвы - милое приведение и т.д.)
Если кому вдруг нужна реклама с него, например для туроператоров или контр, торгующих кондиционерами - пишите, договоримся.