Как найти файлы с нестандартным расширением?

12
Каширин
На сайте с 03.01.2004
Offline
1018
1750

Конечно, ПС их не индексируют. Но поисковые системы содержат ссылки на такие файлы.

К примеру:

<a href="/witness.ix5">Скачать словарь</a>

Каким запросов (последовательностью запросов) можно получить такие ссылки у ПС?

webrock
На сайте с 05.04.2010
Offline
261
#1
Каширин:
Конечно, ПС их не индексируют. Но поисковые системы содержат ссылки на такие файлы.
К примеру:

Каким запросов (последовательностью запросов) можно получить такие ссылки у ПС?

в Яндексе не знаю, а в Гугле ix5 files

мало конкретики.

надо сначало собрать небольшую базу кто использует такое расширение,

внимательно посмотреть в исходном коде, возможно что-то у всех

идентичное, например в футере или какой-нить форме и потом искать

уже по новым следам.

Полный аудит сайтов. (/ru/forum/765361)
Каширин
На сайте с 03.01.2004
Offline
1018
#2
webrock:
в Яндексе не знаю, а в Гугле ix5 files

Что это дает кроме запроса "файлы ix5"?

webrock
На сайте с 05.04.2010
Offline
261
#3
Каширин:
Что это дает кроме запроса "файлы ix5"?

как я понял, вам требуется найти в сети, кто использует такое расширение,

даёт скачать?

или я не правильно понял?

Каширин
На сайте с 03.01.2004
Offline
1018
#4
webrock:
как я понял, вам требуется найти в сети, кто использует такое расширение,
даёт скачать?

или я не правильно понял?

Нужно найти сами файлы с этим расширением. НА которые ссылаются различные страницы в интернете.

YaanGle
На сайте с 06.09.2011
Offline
155
#5
Каширин:
Нужно найти сами файлы с этим расширением. НА которые ссылаются различные страницы в интернете.

В бинге есть оператор contains (к примеру contains:ix5) - ищет страницы содержащие ссылки на файлы заданного типа. Правда, не знаю, имеет ли тут место знание ПС о файлах данного типа, или нет.

Как вариант, можно еще оператором inanchor попытаться поискать, если в анкоре использовалось имя файла с расширением :)

S
На сайте с 29.01.2006
Offline
404
#6

Есть же помощь.

В Яндексе - http://help.yandex.ru/search/?id=1111369 (оператор mime:тип_файла)

В Гугле - Чтобы найти файлы определенного типа (например, PDF, PPT или XLS), добавьте в поисковый запрос слово filetype:, а затем укажите трехбуквенное расширение нужного файла. (пример запроса - конституция рф filetype:_pdf) - черточки быть не должно, я поставил, чтобы смайлик не создавался.

YaanGle
На сайте с 06.09.2011
Offline
155
#7
Scaryer:
Есть же помощь.
В Яндексе - http://help.yandex.ru/search/?id=1111369 (оператор mime:тип_файла)
В Гугле - Чтобы найти файлы определенного типа (например, PDF, PPT или XLS), добавьте в поисковый запрос слово filetype:, а затем укажите трехбуквенное расширение нужного файла. (пример запроса - конституция рф filetype:_pdf) - черточки быть не должно, я поставил, чтобы смайлик не создавался.

Mime сразу не катит, насчет filetype: попробуйте найти к примеру автокадовские файлы (.dwg) - вы думаете ПС их индексируют ?:)

богоносец
На сайте с 30.01.2007
Offline
754
#8
Scaryer:
Чтобы найти файлы определенного типа (например, PDF, PPT или XLS), добавьте в поисковый запрос слово filetype:, а затем укажите трехбуквенное расширение нужного файла.

По запросу filetype:dwg гуглится что-то... оканчивающееся .dwg (по filetype:xml — чаще найдётся text/html с урлами, оканчивающимися .xml)

Scaryer:
В Яндексе - http://help.yandex.ru/search/?id=1111369 (оператор mime:тип_файла)

Там список ограничен. Например по mime:xml ничего не найдётся, но с индексацией XML не всё так.

Xpider
На сайте с 21.11.2008
Offline
121
#9
YaanGle:
насчет filetype: попробуйте найти к примеру автокадовские файлы (.dwg) - вы думаете ПС их индексируют ?

Гугл индексирует пока только 12 типов файлов, о чем честно признается



  • Adobe Flash (.swf)
  • Adobe Portable Document Format (.pdf)
  • Adobe PostScript (.ps)
  • Autodesk Design Web Format (.dwf)
  • Google Earth (.kml, .kmz)
  • GPS eXchange Format (.gpx)
  • Hancom Hanword (.hwp)
  • HTML (.htm, .html, other file extensions)
  • Microsoft Excel (.xls, .xlsx)
  • Microsoft PowerPoint (.ppt, .pptx)
  • Microsoft Word (.doc, .docx)
  • OpenOffice presentation (.odp)
  • OpenOffice spreadsheet (.ods)
  • OpenOffice text (.odt)
  • Rich Text Format (.rtf, .wri)
  • Scalable Vector Graphics (.svg)
  • TeX/LaTeX (.tex)
    • Text (.txt, .text, other file extensions), including source code in common programming languages:
    • Basic source code (.bas)
    • C/C++ source code (.c, .cc, .cpp, .cxx, .h, .hpp)
    • C# source code (.cs)
    • Java source code (.java)
    • Perl source code (.pl)
    • Python source code (.py)
  • Wireless Markup Language (.wml, .wap)
  • XML (.xml)

Купить мобильные прокси можно тут: https://clck.ru/38ub3L
богоносец
На сайте с 30.01.2007
Offline
754
#10
Xpider:
Гугл индексирует пока только 12 типов файлов, о чем честно признается

Честно?

filetype:zip

filetype:xsl

filetype:js но это по куску урла... там больше text/html

12

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий