- Поисковые системы
- Практика оптимизации
- Трафик для сайтов
- Монетизация сайтов
- Сайтостроение
- Социальный Маркетинг
- Общение профессионалов
- Биржа и продажа
- Финансовые объявления
- Работа на постоянной основе
- Сайты - покупка, продажа
- Соцсети: страницы, группы, приложения
- Сайты без доменов
- Трафик, тизерная и баннерная реклама
- Продажа, оценка, регистрация доменов
- Ссылки - обмен, покупка, продажа
- Программы и скрипты
- Размещение статей
- Инфопродукты
- Прочие цифровые товары
- Работа и услуги для вебмастера
- Оптимизация, продвижение и аудит
- Ведение рекламных кампаний
- Услуги в области SMM
- Программирование
- Администрирование серверов и сайтов
- Прокси, ВПН, анонимайзеры, IP
- Платное обучение, вебинары
- Регистрация в каталогах
- Копирайтинг, переводы
- Дизайн
- Usability: консультации и аудит
- Изготовление сайтов
- Наполнение сайтов
- Прочие услуги
- Не про работу

Переиграть и победить: как анализировать конкурентов для продвижения сайта
С помощью Ahrefs
Александр Шестаков

В 2023 году Google заблокировал более 170 млн фальшивых отзывов на Картах
Это на 45% больше, чем в 2022 году
Оксана Мамчуева
Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий
Вот такой алгоритм нарисовался:
1. Расширения
Если .txt, .sh, .php, .module, то однозначно текстовый.
Если .bin, .exe, .com, .zip .rar, .tar, .gz, .gif, .jpeg, .jpg, .png, и т.д. то однозначно бинарный.
2. Специальные маркеры (сигнатуры).
Если в начале Shebang, однозначно текстовый.
Если в начале MZ, ZM, NE, LE, LX, PE, PK однозначно (возможно? могут быть и текстовые такие) бинарный
3. Наличие пробелов
Если есть пробелы, возможно, что текстовый.
Если нет пробелов, возможно, бинарный.
4. два "возможно" дают вывод "однозначно".
Что ещё можно придумать? Вообще, парсинг сигнатур видится монструозным, потому что типов файлов очень много.
В линукс есть утилита file, используйте её:
file -i templates.conf
templates.conf: text/plain; charset=us-ascii
file -i filter_log.sh
filter_log.sh: text/x-shellscript; charset=us-ascii
file -i Снимок\ экрана.png
Снимок экрана.png: image/png; charset=binary
Оптимизайка, тоже метод, согласен.
А на сколько он точен?
А хотя чего я докопался, натравливать надо на файлы без расширения.
1. Из файлов без расширения через "file" выделить тип и присвоить расширения.
2. По расширениям выделить неотображаемые бинарники.
3. По расширениям выделить отображаемые бинарники, например, "картинка".
4. По расширениям выделить отображаемый "код".
5. По расширениям из "код" выделить интерпретатор подсветки синтаксиса.
Усё.
Ну вообще, критерием является наличие/отсутствие "непечатаемых" символов (определенные диапазоны байт). Это в целом, без привязки к структуре и формату файлов. Плюс, нужно учитывать наличие различных кодировок.
Joker-jar, в общем то верно, но прокатит ли с утф16 к примеру?
В дебри уехали…
Когда наладил, нашёл функцию finfo_file :)
Подскажите тогда такое дело: надо по известному MIME восстановить расширения файлов. Может, уже есть?
mime.types из Apache.
Есть еще юникс "филе" - https://ru.wikipedia.org/wiki/File_%28Unix%29
Upd: Пропустил, выше уже написали.
Так и пришлось загнать в массив имеющиеся mime.
Пара вопросов.
Как называется синтаксис, который используют файлы .info модуле Drupal, где точка с запятой означает комментарий? Такой же в AutoIT применяется, но наверняка есть какой-то язык-прародитель.
Среднестатистические синтаксисы ini, cnf. conf какие? Временно назначил application/x-shellscript.
/UPD
По первому — Ассемблер же 😂
У кого под рукой Windows, подскажите, в какой кодировке .vbs файлы идут — CP1251, или CP866?