hEckA

Рейтинг
83
Регистрация
10.03.2009


<?php
function translate($text, $from, $to) {
$agent = "Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 5.1; .NET CLR 2.0.50727; .NET CLR 1.1.4322)" ;
$header [] = "Accept: text/html;" ;
$header [] = "Accept_charset: utf-8";
$header [] = "Accept_encoding: identity";
$header [] = "Accept_language: en-us";
$header [] = "Connection: Keep-Alive";
$ch = curl_init ();
$url = 'http://translate.google.com/translate_a/t?client=t&text='.urlencode($text).'&sl='.$from.'&tl='.$to;
curl_setopt ( $ch , CURLOPT_URL , $url );
curl_setopt ( $ch , CURLOPT_RETURNTRANSFER , 1 );
curl_setopt ( $ch , CURLOPT_VERBOSE , 1 );
curl_setopt ( $ch , CURLOPT_USERAGENT , $agent );
curl_setopt ( $ch , CURLOPT_HTTPHEADER , $header );
curl_setopt ( $ch , CURLOPT_FOLLOWLOCATION , 1 );
$tmp = curl_exec ( $ch );
curl_close ( $ch );
$tmp = substr ($tmp, 1, strlen ($tmp)-2);
$pos1=strpos($tmp,"trans\":\"")+8;
$pos2=strpos($tmp,"\"",$pos1);
$tmp=substr($tmp,$pos1,$pos2-$pos1);
return $tmp;
}

echo translate("my name is jack","en","ru");
?>

P.S. for free ;)

P.S.S. еще 2 часа назад я бы назвал это парсингом, а теперь знаю, что to parse - проводить грамматический анализ :) В соседней теме статья интересная :)

сейчас посмотрел на api, я конечно прогер, но мне кажеться даже валенок по смыслу поймет что куда подставить :)


<html xmlns="http://www.w3.org/1999/xhtml">
<head>
<meta http-equiv="content-type" content="text/html; charset=utf-8"/>
<title>Google AJAX Language API - Basic Translation</title>
<script type="text/javascript" src="http://www.google.com/jsapi"></script>
<script type="text/javascript">

google.load("language", "1");

function initialize() {
google.language.translate("Hello world", "en", "es", function(result) {
if (!result.error) {
var container = document.getElementById("translation");
container.innerHTML = result.translation;
}
});
}
google.setOnLoadCallback(initialize);

</script>
</head>
<body>
<div id="translation"></div>
</body>
</html>

Smile8979:
Содись - два, способов масса:
Автоматический рерайт
Синонимизация
Перевод из русского в инглиш(или любой другой язык) и обратно + использование схеммы исходный текст -> перевод в первый язык -> во второй -> в третий -> и обратно.
Это первое что пришло на ум не считая математических алгоритмов блоаго математика Марковым не заканчивается.
Ну и не забываем если уж очень сильно углубляться про NLP (Википедия Хабр)

спасибо!

Есть ли функция или класс на php, которому дать исходный текст, а он возвратит обработанный текст?

ADDED:

хех :) в соседней теме нашел линк на документацию по api гугл-переводчика. Наверное его и заюзаю. Спасибо еще раз, что столько инфы насыпали :)

А серия статей с хабра интересные! Может мало применима на практике, но факты интересные! Теперь понятно почему переводчики-программы так плохо переводят :)

Assessor:
уник текста можна сгенерить очень много.
Только надо ли оно ?

т.е. хотите сказать делать шопы с той же информацией? Совсем ее не изменяя? Ведь такой подход может плохо сказаться на самом первом шопе, либо на новых...

Oshparennij:
То будет явный ГС... Безсмысленный, лучше скажите свои цели, так будет проще чтото посоветовать....

есть белый шоп с уникальной инфой (много уник инфы), хочу сделать еще парочку на основе этого. Люди будут видеть информацию в нормальном виде (клоакинг).

Smile8979:
Дело не в количестве строк кода а в подходе к методу генерации :)

что это за методы, помимо рандомного расположения кусков исходного текста и всучивания в них ключевиков?

Oshparennij:
Лучше писать с нуля.... Ибо Вам прийдется очень сильно переставлять все местами... и не только предложения, но и слова в предложениях тоже....

а если это сделает за меня самый простой самописный скрипт в несколько строк? Как отнесутся поисковики к этому?

я чето невдуплю, что с одной ссылки может передаться 2 ТИЦа? я думал, что ТИЦ=количеству сайтов ссылающихся на твой сайт. И каков тогда максимально возможный передаваемый ТИЦ и от чего он зависит?

seonik:
hEckA, ТИЦ может быть даже у несуществующих сайтов.
Или даже вот так

да что Вы прицепились к этому ТИЦ? Сайты, о которых говорю я, существуют. ТИЦ у них >=10,ссылки с них адекватно воспринимаются, следовательно яша их индексирует, что я и пытался сказать своей репликой о ТИЦ :)

seonik:
hEckA
Откуда такая уверенность, что эти ссылки дают Вам ТИЦ? Вы умеете измерять размер передаваемого ТИЦа?

мммм, кажеца, что да) ТиЦ=количество сайтов ссылающихся на мой сайт, количество сайтов видно из панели-вембастера. По крайней мере, в моем случае это правило всегда работало :) хотя и занимаюсь я этим совсем недавно, могу ошибаться. Если я ошибаюсь, прошу объяснить.

P.S. главное не отходить от главного вопроса 🍻

seonik:
А как связаны язык сайта и его ТИЦ?

в том то и дело, что никак, я сказал о ТиЦ, подразумевая, что русские ПС индексируют не только русскоязычные сайты, на что утверждал Webexpert :)

seonik:
Что Вы подразумеваете под "учитывает ссылки"?

я вижу ссылки в панели вебмастера у яши, для раскручиваемого сайта. То есть эти ссылки дают мне дополнительный ТИЦ. Вот. не знаю как это правильно сказать по сео-вски)

1 234
Всего: 31