- Поисковые системы
- Практика оптимизации
- Трафик для сайтов
- Монетизация сайтов
- Сайтостроение
- Социальный Маркетинг
- Общение профессионалов
- Биржа и продажа
- Финансовые объявления
- Работа на постоянной основе
- Сайты - покупка, продажа
- Соцсети: страницы, группы, приложения
- Сайты без доменов
- Трафик, тизерная и баннерная реклама
- Продажа, оценка, регистрация доменов
- Ссылки - обмен, покупка, продажа
- Программы и скрипты
- Размещение статей
- Инфопродукты
- Прочие цифровые товары
- Работа и услуги для вебмастера
- Оптимизация, продвижение и аудит
- Ведение рекламных кампаний
- Услуги в области SMM
- Программирование
- Администрирование серверов и сайтов
- Прокси, ВПН, анонимайзеры, IP
- Платное обучение, вебинары
- Регистрация в каталогах
- Копирайтинг, переводы
- Дизайн
- Usability: консультации и аудит
- Изготовление сайтов
- Наполнение сайтов
- Прочие услуги
- Не про работу
В 2023 году Google заблокировал более 170 млн фальшивых отзывов на Картах
Это на 45% больше, чем в 2022 году
Оксана Мамчуева
Зачем быть уникальным в мире, где все можно скопировать
Почему так важна уникальность текста и как она влияет на SEO
Ingate Organic
Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий
На одном собеседовании дали решить задачу. Вакансия подразумевает системный анализ и базы данных.
Есть таблица (xls) в которой 2 колонки:
1. Название компании
2. адрес сайта
Есть таблица №2. в которой только одна колонка, а в ней список отраслей (к примеру 20 вариантов: id1= инет, id2=промышленность и т.д.)
Вопрос: как правильно присвоить отрасль для каждой компании, если мы изначально не знаем какая компания к какой отрасли относится?
Задание описано не польностью. Слишком большое количество деталей не сказано как в исходных данных так и в вопросе.
Вопрос можно также сформулировать: как угадать имя человека, имя которого мы ещё незнаем? Утрирую конечно.
Если количество строк в обеих таблицах совпадает, то может так?
таблица1.строка1 = таблица2.строка1
...
таблица1.строкаn = таблица2.строкаn
Логически.
Попытаться присвоить компаниям отрасль по названию сайта и самой компании.
Логично что "Уралтяжмаш" будет ближе к производству техники, а ITMedia.ru к АйТи тематике.
Конечно существуют названия типа "Уроборос", и по названию ничего не скажешь, но таких от силы останется 5-6. В этом случае начинаем искать ключевик в домене.
(Не было указано, что так нельзя, на худой конец можно написать скриптик, который бы сравнивал слова из 2 таблицы с первой.)
Рспределить как попало, потом если будут разгнванные звонки, постепенно исправлять.
Я бы прошелся по всем сайтам, вытащил бы тексты, титлы, ключевики и декскрипшены всякие.
Потом либо глазами, либо всякими кластеризаторами выделил бы характерные слова для каждой категории и присвоил бы нужные категории тем фирмам, у которых ключевые слова совпадают
для составления списка ключевых терминов отрасли - можно поискать словари.
То что автоматом не выделится - смотреть глазами и модифицировать список слов.
P.S. Если надо научности добавить - можно нейросети впихнуть
категорию из ЯК посмотреть...
Я бы прошелся по всем сайтам, вытащил бы тексты, титлы, ключевики и декскрипшены всякие.
На такой вариант появляется условие: кол-во записей компаний 2 млн.
В общем добиваюсь дополнительных переменных, т.к. эта задача не решаема. Напишу позже.
На такой вариант появляется условие: кол-во записей компаний 2 млн.
Ну принципиально размер неважен :) Или вам надо за 10 минут это сделать?)
Для сокращения выборки можно пройтись по названиям - попытаться из слов названий составить классы. Ну и если это собеседование - нужно не реализацию делать, а принципиальный подход :)
Вопрос: как правильно присвоить отрасль
мы изначально не знаем какая компания к какой отрасли относится
правильно никак, максимально близко - уже сказали
P.S. решите лучше задачу "как правильно написать курс доллара на завтра", там хоть инструментарий есть
На одном собеседовании дали решить задачу. Вакансия подразумевает системный анализ и базы данных.
Есть таблица (xls) в которой 2 колонки:
1. Название компании
2. адрес сайта
Есть таблица №2. в которой только одна колонка, а в ней список отраслей (к примеру 20 вариантов: id1= инет, id2=промышленность и т.д.)
Вопрос: как правильно присвоить отрасль для каждой компании, если мы изначально не знаем какая компания к какой отрасли относится?
Т.к. это собеседование, то скорее всего от вас требовался не обязательно оптимальный, но вполне рабочий ответ. И конечно не подразумевается что этим надо будет заняться прям на собеседовании.
Вполне решаемо может быть так:
1. Анализ последовательностей в названиях фирм. Наример "УкрТяжПром", "ОАО Рыболов", "ФЛП АгроПром".
2. Анализ слов, находящихся на сайтах фирм (парсинг).
3. Если имеется ввиду, что как это непосредственно сделать в Excele, то надо видеть саму таблицу.