Аякс и гугл

1 23
богоносец
На сайте с 30.01.2007
Offline
768
#21
aftamat4ik:
Location: http://aftamat4ik.ru/index.php

/ и /index.php и являются дублями

А с кириллицей в урлах ещё бывают проблемы

http://ru.wikipedia.org/wiki/%CF%EE%F0%EE%F5

http://ru.wikipedia.org/wiki/%D0%9F%D0%BE%D1%80%D0%BE%D1%85

из лучших побуждений создателя.

Вот сразу два дубля.

A4
На сайте с 05.01.2012
Offline
55
#22

богоносец, - сделал для не верных хешей 301 редирект))

код примерно такой(там у меня проще ...):


if(hash != "#!" && hash!=lasturl && hash && (hash.indexOf("#!searsh=") = -1) && (hash.indexOf("#!authorname=") = -1) && ..все переменные так..){
lasturl = hash;
window.location.href="http://www.aftamat4ik.ru/page404.php";
}

Ну тут из за эскейп комбинации в урл в первом случае, а вот во втором - откуда там Русское слово Гексоген, должна же быть эскейп последовательность, ибо кириллица как понятие в урл не воспринимается(ну я что то вроде того читал...)

или я не так понимаю о_0? Ну у меня вроде как все буквы в эскейп последовательности идут(там где есть кирилиица стоит encodeURIComponent(), без этого картинки не показывает и мызыка не играет...)

Вот пример запроса к серверу страницы #!Грот(файрбаг, вкладка сеть - параметры)

album default

artist %D0%93%D0%A0%D0%9E%D0%A2

songs default

Грот превратился в эскейп из-за энкодеурикомпонент, а англицкие как были на англ так и остались)

301 редирект с index.php на /


RewriteCond %{QUERY_STRING} ^$
RewriteRule ^index.php$ / [R=301]

http://aftamat4ik.ru/audio/%D0%93%D0%A0%D0%9E%D0%A2/%D0%92%D0%B5%D1%80%D1%88%D0%B8%D1%82%D0%B5%D0%BB%D0%B8%20%D1%81%D1%83%D0%B4%D0%B5%D0%B1%20(2010)/%D0%93%D1%80%D0%BE%D1%82%20-%20%D0%97%D0%BE%D0%BB%D0%BE%D1%82%D0%B0%D1%8F%20%D1%82%D1%80%D0%BE%D0%BF%D0%B0.mp3 - ссылка из хрома

http://aftamat4ik.ru/audio/КняZZ/Письмо%20из%20Трансильвании/КняZZ%20-Вервольф.mp3 - то-же самое из ff(почему то ток пробелы заменились...)

песни конечно разные, но там везде так...

Это повод для тревоги? вроде страниц для каждого трека отдельых у меня пока нету(будут, аха, но потом...)

---------- Добавлено 06.07.2012 в 11:10 ----------

Я тут про клоакинг почитал - это когда боты яндекса и гугла вычисляются и им отдается другой контент по одному и тому-же урлу...

В принципе можно вычислить бота гугла и редиректнуть его на странничку с _escaped_fragment=

Вроде я никаких правил не нарушу этим? хотя тут напсано что за такое своевольство банят...

http://it.sander.su/cloaking.php

но что поделать если бот гугла настолько туп и не соответствует своей-же документации....

Оно стоит вообще за это браться? В принципе код легкий, написать просто... Опять-же яндексу проще будет индексировать, но вот если спаляь - будет обидно, вроде ничего не нарушил, а наоборот улучшил - а тебя из индекса выкинули...

---------- Добавлено 06.07.2012 в 11:30 ----------

Почему гугл так индексирует - там же параметр title в самой ссылке заполнен, я даже сейчас вам код ссылки выложу.

вот как видит гугл:

Вот код ссылки:

<a class="link" href="/#%21find=%D0%9B" title="Поиск исполнителей по букве Л">Л</a>

То есть в гугле строка

<<Список всех исполнителей (к сожалению пока есть только это(памяти на хостинге мало). ГРОТ · Денис Майданов · Noize · AK-47 · Catharsis · Елка · Нюша ...>>

по моему личному мнению должан заменится на "Поиск исполнителей по букве Л", или я что-то не так думаю?) вот код элемента, который идет вместо заголовка

<p>Список всех исполнителей (к сожалению пока есть только это(памяти на хостинге мало).</p>

это Параграф! Почему гугл параграф берет как заголовок, когда есть явно прописаный тег титле?)) Странно, однако...

богоносец
На сайте с 30.01.2007
Offline
768
#23

У создателей сайтов просто свойство есть такое — плодить дубли

http://aftamat4ik.ru/?_escaped_fragment_=authorname=%D0%93%D0%A0%D0%9E%D0%A2

http://aftamat4ik.ru/?_escaped_fragment_=authorname=%C3%D0%CE%D2

200 ОК

это всё дубли

https://searchengines.guru/

/

Но с кириллицей всё ещё хуже.

Какой запрос пошлёт браузер, если ссылка http://aftamat4ik.ru/#!authorname=ГРОТ будет на странице с кодировкой виндовс-1251 ?

И лучше бы уделить внимание понятному для искателю названию и правильному расположению в HTML

<div id="main"><!-- albums -->

<title>Исполнитель ГРОТ</title>

aftamat4ik:
href="/#%21find=%D0%9B"

может лучше

href='/#!find=Л '

или

href='/#!find=%D0%9B'

И закладывать так глубоко в ссылочной структуре именно то, что и будут искать — можно просто не дождаться индексации всего этого чужого добра.

[Удален]
#24

что-то я не понимаю - зачем так заморачиваться?

всё ведь на много проще, и яндекс, и гугл прекрасно индексируют всё что им дают (к сожалению иногда даже больше)

если вы используете аякс, то зачем искать себе на пятую точку приключения с url?

не используйте в url ни чего кроме цифр, латиницы в нижнем регистре, дефиса, нижнего подчёркивания и точки.

и будет вам счастье! :)

A4
На сайте с 05.01.2012
Offline
55
#25

вывод алфавита поправил:

<?php
for ($i = 0x410; $i <= 0x42F; $i++) {/*тут все сложно. я хз как оно работает, и мне пох на это, главное Работает!*/
$uc = chr(0xC0 | $i >> 6 & 0x1F) . chr(0x80 | $i & 0x3F);
echo "<li><a class='link' href='/#!find=".urlencode($uc)." 'title='Поиск исполнителей по букве ".$uc."'>".$uc."</a></li>";
}
?>

- способ вывести все буквы русского алфавита в пхп. Может пригодицо кому, сам еле нарыл))

теперь там: http://aftamat4ik.ru/#!find=%D0%9B

с авторнаме тоже все поправил

http://aftamat4ik.ru/#!authorname=%D0%94%D0%B5%D0%BD%D0%B8%D1%81%20%D0%9C%D0%B0%D0%B9%D0%B4%D0%B0%D0%BD%D0%BE%D0%B2 - это Г. Лепс.

Все кодируется в эскапе) Я просто не заметил что в верхней блоке не используется rawurlencode )) в main все через эту функцию сделано



---------- Добавлено 06.07.2012 в 14:14 ----------

burunduk:
что-то я не понимаю - зачем так заморачиваться?
всё ведь на много проще, и яндекс, и гугл прекрасно индексируют всё что им дают (к сожалению иногда даже больше)
если вы используете аякс, то зачем искать себе на пятую точку приключения с url?
не используйте в url ни чего кроме цифр, латиницы в нижнем регистре, дефиса, нижнего подчёркивания и точки.
и будет вам счастье! :)

Хех)) там и так тока англоязычные символы и цыфры используются - это эскейп послеловательность. Просто броузер ее в нормальный читаемый вид сам переделывает. Не, вот именно что у меня в индексе гугла пока только 23 страницы, из которых 80% - это НЕ то что мне надо, а наоборот то - что я с таким мучением выпиливаю))

сами смотрите хДД :

https://www.google.ru/webhp?rlz=1C1AVSX_enRU453RU453&sourceid=chrome-instant&ie=UTF-8&ion=1#hl=ru&newwindow=1&rlz=1C1AVSX_enRU453RU453&sclient=psy-ab&q=site:aftamat4ik.ru&oq=site:aftamat4ik.ru&gs_l=serp.12...0.0.0.34607.0.0.0.0.0.0.0.0..0.0...0.0.0m6wBO1cQgk&pbx=1&bav=on.2,or.r_gc.r_pw.r_cp.r_qf.,cf.osb&fp=fd2cf4e896a87c19&ion=1&biw=1024&bih=485

_________________________________

Но ответить не готово,

Небо над моей головой.

Для чего я здесь,

Считаю каждый день...

(Кипелов - Вавилон)

---------- Добавлено 06.07.2012 в 14:17 ----------

Я все больше начинаю смотреть в сторону Клоакинга... хДД

---------- Добавлено 06.07.2012 в 14:27 ----------

----оффтоп...---

Burunduk, Защита от воровства! - я бы сделал так:

Исходим из того, что в большинстве случаев воровство контента делается не Руками а специальным ботом. Делаем так:

1 - определяем тип клиента - если это броузер типа мазилла, хром или ие, или поисковые боты, то показываем статью. для доп. защиты можно в скрипте написать защиту от копирования(в инете есть скрипты)

2 - если это не броузер и не бот гугла, а что-то иное, то перекидываем его на страничку, например с кракозябрами хДД Зло, страшно, затос делать относительно просто, и наверное сработает хД Но это так догадки.. Угадал?)

---------- Добавлено 06.07.2012 в 14:29 ----------

это всё дубли


https://searchengines.guru/
/

Устранено)) вотЪ http://aftamat4ik.ru#!©hash™H₂O 301 редирект на главную

1 23

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий