sgrumi

Рейтинг
8
Регистрация
04.10.2018
Leonid H:
Например комментарии к Ютуб видео.
чтобы посмотреть( подгрузить ) остальные комментарии, надо прокручивать страницу.
Как парсить такую страницу?

Вариант 1:

Если есть документированное API - это лучший вариант.

Вариант 2: реверс-инжиниринг API.

Минусы: куча усилий. Которые еще и повторить придется при изменениях на сайте. Можно столкнуться с мерами противодействия сайта реверс-инжинирингу.

Плюсы: в конечном итоге будет работать быстрее пункта 3 и потреблять меньше ресурсов, чем в пункте 3. Сопоставимо с пунктом 1.

Вариант 3:

Нужен специализированный браузер, управляемый снаружи:

PhantomJS - удобнее для отладки.

SlimerJS - жрет меньше ресурсов.

Selenium - более известен, но жрет дофига ресурсов, так как это полноценный, но управляемый снаружи, браузер.

С точки зрения сайта - эти браузеры имитируют поведение пользователя.

Прокручиваем куда надо и парзим DOM.

---------- Добавлено 12.10.2018 в 15:59 ----------

miketomlin:
Во-во, серьезные сайты так и устроены. Публичный контент можно получать без всяких аяксов, эмуляций и т.п.

Фейсбук, один из крупнейших сайтов в мире - не серьезный?

---------- Добавлено 12.10.2018 в 16:02 ----------

nozzy:
Можно использовать Selenium для парсинга этой инфы.

Избыточно.

Нужен SlimerJS или PhantomJS.

Если же на сайте есть какая-то умная защита и нужна будет 100% эмуляция браузера, а той частичной эмуляции, что делает SlimerJS будет недостаточно - то только тогда и имеет смысл смотреть на Selenium.

Ибо Selenium слишком уж много ресурсов жрет.

smart2web:
Варианты есть всегда. Но разница лишь в том, что я рассказываю факты, в сфере которой работаю, а вы теорию, которую придумали и думаете что именно так обстоят дела. А все хостеры настолько тупые, что не могут сделать все дорого и качественно. Вы серьезно так думаете?

Да, судя по тому как вы шапкозакидательски пишете, многие хостеры не особо компетенты:

smart2web:
Ух сколько умных то набежало. А по факту арендуй самый крутой дедик, поставь нормальные\высокие цены, организуй качество.

Купить дедик - ума не нужно.

Самое сложное тут: " организуй качество", чему вы даже в тексте своем не уделили значительного внимания. Считаете качество само самим разумеющимся, автоматом возникающим? Вся проблема в дорогом дедике?

И это только еще только ваша внутренная кухня. Как сделаете качество, если сможете вообще - еще и раскрутка будет нужна.

Stek:
OVH все таки довольно вменяемы и балансируют между параноей и жадностью. .

В отношении серверов, возможно.

В отношении использования их сети - очень жестоки. Скажем, пытались сделать кластер на их дешевых серверах (чтобы без внутренней сети за отдельные бабки которая) - весьма параноидально банят за подозрительный трафик. Между моими собственными серверами.

---------- Добавлено 12.10.2018 в 15:24 ----------

globalmoney:
А что мешает заблокировать их подсети на уровне файрволла?

Это крупный хостер.

А если твои клиенты ходят через VPN/proxy, находящийся у этого хостера?

---------- Добавлено 12.10.2018 в 15:28 ----------

Stek:
или "а докажите, что сервак ваш, шлите нотариальное подтверждение или приедьте вместе с сервером к нам в Урюпинск".

99% датацентров под хостинг - находится в Москве, Питере, ближнее Подмосковье.

Давно искал для геораспределения нагрузки сервера под аренду хотя бы в крупных городах РФ - очень мало.

А Вы про какой-то Урюпинск придумываете.

Если у вас инфа про то, где можно разместить сервера хотя бы во всех в региональных центрах страны (где это как развитая услуга, чтобы все можно было сделать удаленно) - буду рад ссылкам.

magicom:
Доброго времени.

Сайты из вебархива. Чтобы хотябы не по просьбе закрывались, а по решению суда.

Любая страна. Ценник тоже важен.

Если потребители европейцы или американцы - то РФ.

Если потребители РФ - то Европа или США.

smart2web:

Да есть хостеры под корп сегмент рынка. Там дорого и качественно, но уверяю, вы про них даже и не слышали.

Поделитесь.

---------- Добавлено 12.10.2018 в 15:15 ----------

Aisamiery:
Скорее всего, вы пошли в какой то больно "жирный" банкт типа сбера или втб, большая часть небольших франчайзи уложится в вашу сумму и именно таких бизнесов открывается сотнями в день и большая часть из них на кредитные средства. Есть же разные банки :))

Конкретно это - ответ Газпромбанка.

Это давно было, много лет назад, тогда кредитование особо малого бизнеса еще не было.

Те, кто называли себя "банками, кредитующими малый бизнес", тоже рассматривали от бОльших сумм, чем мне надо было.

Но то, что называется "кредитование особо мелкого бизнеса", по сути, обычный потребительский кредит. Там проценты не интересные.

Aisamiery:
Индикаторы по ставкам по мне так это как бы странная отмазка. Во-первых, эти люди берут по тем же ставкам себе квартиры и машины которые не приносят прибыль, а только убытки и доп расходы

Ипотека - это квартира в залоге у банка на годы, а то и десятилетия, у банка риски другие. Не показатель.

Потребительские кредиты, что дают налево и направо без обеспечения и проверок глубоких, но маленькие суммы - другое дело.

Я про коммерческие кредиты. Те, что дают на бизнес.

Там совсем другие условия. Я как-то хотел взять. рассчитал бизнес-план, пришел в банк. Знаете что сказал банк - "Мы с такими мелкими суммами по кредитам для бизнеса не работаем". У меня была сумма порядка 1 500 000 рублей по бизнес-плану. Сколько, спрашиваю? Они говорят - от 5 000 000 рублей будем рассматривать.

Так что не путайте это с потребительскими кредитами.

Aisamiery:
Простой пример, у нас знакомые взяли огромное помещение коммерческое, выкупили за неприлично большую сумму, сдали его магниту, окупили помещение за 2-3 года, сейчас одна сплошная прибыль

1) Это ипотечный кредит. Жилое или коммерческое помещение - другое дело. Но это ипотечный кредит. Там помещение в залоге.

2) Полагаю - 2-3 года это окупаемость не на Западе была?

Aisamiery:
Да плевать всем на железо, их уникальность была в том, что они смогли предоставить то, что никто другой не смог за те деньги что предоставили они.

Согласен.

Но чтобы получить железо по такой цене и чтобы это железо продать по низкой цене в аренду в объеме достаточном для окупаемости - нужны были изначально большие деньги.

1-2 сервера чтобы сдавать по такой цене в аренду - это только если вы в перерывах между работой админить их сами будете.

Если речь идет о бизнесе, то нужен и персонал (зарплата) и юр. лицо (налоги) - и без первоначальных вложений серьезный - никак так не сделаешь, чтобы это стало именно что бизнесом, а не хобби.

В принципе, чтобы сделать датацентр на базе говна - не так уж и много денег надо. Не безыизвестный тут на форуме забаненный навечно Виталик из Нска так делает. У себя в квартире. У друга в сарае. И даже железо не самое дешевое (потому что не хочет с железом мучений), ну а взял бы треш-железо за те же деньги - так у него было бы уже наверное под 100 серверов. И это все без кредитов. Это не так сложно. Была бы цель.

smart2web:
Ух сколько умных то набежало. А по факту арендуй самый крутой дедик, поставь нормальные\высокие цены, организуй качество. Так и просидишь с ним пол года, с пару клиентами, если найдутся такие. Вот вам и вся правда жизни. Вложился, через пол года обломался и пошел дальше искать работу. И не надо тут рассказывать как оно все делается, когда сам этого не делал. Не хотят клиенты качества за достойную цену. Лучше взять лоукост и постоянно ныть, какой он плохой. Это факт!

Скажу даже более:

Дедик не нужен. Прекрасно перепродавал на виртуалках хостинг.

Другое дело, что не рассматривал как бизнес, а только чтобы мои сайты окупались за счет клиентских аренд.

Когда цена хостинга упала до неприличных масштабов - надоело мне возиться с клиентскими сайтами - методом повышения большую часть арендаторов разогнал. Оставил только самых жирных, что согласны хорошо платить.

Stek:
В нужное время в нужном месте. И явно не по заслуге пентиума или малого финансирования в первый сервер.

А вот и нет.

Рамблер тоже был в нужное время и в нужном месте.

Aisamiery:
Это человек еще не учел что Яндекс 6-7 лет в минус работал, но это мелочи, главное пентиум и то что в сервер не вложили миллионы :))
PS. Хотя они вложили туда очень много денег прежде чем вышли на прибыль, правда не в пентиум

Несмотря на то, что у Рамблера с финансированием было не в пример лучше, чем у Яндекса....

Почему Рамблер в нужном времени и в нужном месте и с огромными инвестициями, но сдох? Когда Яндекс будучи даже в худших финансовых условиях взлетал.

---------- Добавлено 12.10.2018 в 14:46 ----------

Aisamiery:
Я не имел ввиду написать свой собственный openstack, я имел ввиду написать те вещи администрирования, что руками сейчас делают люди и системы, которые упростят управление всем этим, боюсь таких вещей готовых очень мало и в целом их лучше не использовать, потому что никто свои такие наработки не выкладывает по многим соображениям.

Это страшно дорого. Вы даже не представляете.

Дешевле 3-х админов средней руки держать год, чем нанять devops и автоматизировать хотя бы 50% работы выполняемой админами.

Под лежачий камень конечно вода не течет. Что то делать нужно.

Но вы слишком уж переоценивайте простоту/дешевизну/эффективность автоматизации.

Aisamiery:

Действительно, вкладывают свои средства в стартап наверное только идиоты, для этого есть инвесторы как правило у которых есть эти инвестиции под риски. Но все это ваши отмазки, если с ними вам живется проще - так и продолжайте, не парьтесь, оно вам не надо :)

На самых ранних этапах вкладывают те, кто обозначен на западе специальным термином FFF (семья, друзья и дураки). Не те венчурные инвесторы, о которых вы говорите.

Посмотрите саму раннюю историю хоть Apple, хоть Yandex.

Но да, собственных денег всегда мало, если вы не сын Онасиса, и первым делом, если проект нормально стартанул и инвестору есть что показать, находят уже нормальных инвесторов.

---------- Добавлено 12.10.2018 в 14:35 ----------

treshnyuk:

Тут стоит разделять базовую консультацию хостера и "поправьте мне цвет логотипа на сайте".

Просто отправлял своих хостующихся к знакомым программистам. Правда и эти программисты оказались дороговатыми для владельцев сайта.

-= Serafim =-:
Потому что они везде пытаются продавить и найти место, где получить что-то из услуг/товаров дешево или бесплатно. Просто нужно везде спокойно отказывать в халяве и указывать цену за платные услуги. Они все равно заранее готовы к отказу, потому просто не нужно стесняться отказывать.

Никак хостующихся не терял, что отказывал им в сверхподдержке.

Они еще годы и годы работали со мной. Правда пытались свалить на меня, что цвет логотипа неправильного цвета потому что у меня хостинг глючит. Но безуспешно. И работали и работали годами.

А потом они мне надоели и я их выгнал - повышением цены. Но не отказ на сверхобъемную тех. поддержку, а именно цена - и заставила их переехать.

smart2web:
А вот и нет. Сразу вкладываются только идиоты или вкладываются в золото\брилианты. А в стартап не инвестируют никогда больших денег. Видели первый сервер яндекса? Пентиум 2 с 387 мб. оперативы. Почему они сейчас корпорация? Ведь по вашему не вложив они на старте миллионы уже бы давно не работали.

Потому что их единственный реальный конкурент Рамблер был выкуплен жирными инвесторами, мечтающими быстро навариться, но не способными управлять ИТ-проектом. ИТ-руководство купленного Яндекса не умело (а наверное и не хотело, а в последствие, когда инвесторы стали строго спрашивать - и не могло) - и собственно мечтало тоже по быстрому срубить бабло и срулить. В Яндексе же Волож в этом смысле, напротив, жестко держал руль.

Здесь разжевано ярким художественным языком что творилось с Рамблером когда Яндекс всплывал вверх

Ашманов. Жизнь внутри пузыря

ENELIS:
или же работает OVH ("кампус" стартап, в последствии крупная го-спонсированная контора

Да, это нормально.

Есть такой наш бывший соотечественник, живет во Франции. Его проект в вебе - NationOrg.

По его мнению, там чуть ли не социализм - огромные госсубсидии. Он в частности, живет за счет того, что по госдотациям обучает русских французскому языку, а французов русскому (я тоже удивился).

И все хочет как-то в ИТ пролезть, с каким-то проектом. По его словам - можно относительно легко государственные деньги получить под проект, достаточно предоставить техническое обоснование государству французкому.

---------- Добавлено 12.10.2018 в 14:16 ----------

Aisamiery:

Так вы махнули сразу на обороты, может конечно про 10 лет я загнул, но мой посыл был в том, что люди вкладывают на перспективу, делают вначале хороший конкурентный продукт, а вот потом начинают его продавать. Вы посмотрите на моменты когда это все появлялось и как стартовало, в какие моменты и что на тот момент было.

Это вы про то говно, на котором начинали и Hetzner и OVH, да и сейчас не далеко по качеству железа ушли от того говна?

Но то что их бизнес рассчитан на десятилетия - согласен. Но не без окупаемости же эти 10 лет-то.

Всего: 126