Сканированные тексты - вопрос

Калинин
На сайте с 20.06.2006
Offline
310
#11

Да не спер я! :) Вот, доказывай теперь, что не верблюд...

Короче, по сабжу понятно - бизЭс на доверии.

Бизнес на доверии - признак либо нарождающегося бизнеса, либо столетиями отстроенного. Делаю выводы ;)

Калинин добавил 27.02.2008 в 19:24

юни:
Плюс ко всему, эти люди вряд ли перепродают контент

Вот слово "вряд ли" напрягает...

юни, спасибо. Адреса можешь кинуть?

Покупка антиквариата: /ru/forum/868704 ()
юни
На сайте с 01.11.2005
Offline
913
#12
Калинин:
Вот слово "вряд ли" напрягает...

Им это нафик не надо. Ну, представь, что люди, оцифровывающие Центризбирком, будут делать сателлиты про попугаев.

Представил? Я тоже не могу.

Калинин:
Адреса можешь кинуть?

Любая приличная контора отсюда. Приличность определяется наличием офиса, схемами оплаты, вежливостью персонала и спектром услуг (такой порядок - из опыта).

https://searchengines.guru/ru/forum/944108 - прокси-сервис на базе операторов домашнего интернета, сотни тысяч IP-адресов, канал от 20 Мбит
S2
На сайте с 07.01.2008
Offline
611
#13

Типо этой? http://www.scandocs.ru/page.jsp?pk=node_1138962530039

Я думал вы спрашиваете об общем случае, а не об конкретной ретро книжке.

Не надо приписывать мне свои выводы, я имею ввиду только то, что написал. Лучшая партнёрка по футболкам/толстовкам (http://partnerka.kolorado.ru/?ref=1921540) Опрос: Проверить текст на уник - как? (/ru/forum/495885)
Dyachek
На сайте с 15.12.2007
Offline
128
#14

Задумывался над этой темой. Даже насканировал контент, но потом столкнулся с такой проблемой, как форматирование текста, которое занимает достаточное количество времени.

Далеко не редкость, чтобы встречалось, допустим такое: "И как вы успели заметить в главе 2 ..." и т.д. Это всё надо корректировать, что также сказывается на цене.

Также ещё зависит от оригинала. Я насканировал контента на 150к уников, но полазив там супел выделить только 12 глав. Конечно, пошаманив ещё 2 дня я сделал ещё 50 глав, но ведь это время.

Так что, тут всё совершенно не так всё просто. И самое главное, что помимо умения пользоваться файнридеров, клавиатурой, необходимо иметь полное представление о том, что сканируешь.

Моя тема это Финансы, вот по ней я могу работать, но достав редкую книгу по Географии, даже не стал с ней ничего делать.

Также следующий вопрос это поиск материала, это, имхо, и есть самый главный вопрос.

Во-первых во всей книге может быть только 20 подглав и куча и две тележки таблиц, что делает невозможным сканирование. Для меня проще написать самому текст, чем таким трудом работать.

Также по поводу контента могу ещё сказать, что контент контенту рознь и зачастую, когда берёшь книгу по Трейдингу выпуска конца 90-ых, то там актуальность контента имеет немалые погрешности, которые, конечно, можно отредактировать, но только если знаешь специфику самого материала.

В общем, в итоге всё сводится к тому, что если знаешь свою тему, то можно работать для качественного контента, но в результате по затратам он будет приблизительно равен стоимости копирайта.

Конечно, можно плюнуть на весь смысл текста, а использовать его тупо, как уникальный. Но тогда не будет пользы для конечного потребителя (хотя по личным наблюдениям увеличивает CTR по контексту :))

Собственно, всё далеко не всё так просто, как представляется на первый взгляд.

Калинин
На сайте с 20.06.2006
Offline
310
#15
Str256:
Типо этой? http://www.scandocs.ru/page.jsp?pk=node_1138962530039
Я думал вы спрашиваете об общем случае, а не об конкретной ретро книжке.

Не о конкретной книжке (хотя у меня таких навалом) и не об общем случае, а о всем бизнесе в целом.

юни, спасибо, душа-человек! :)

Solser
На сайте с 03.07.2007
Offline
122
#16
А можно озвучить время, которое на самом деле тратится сканеристом (о, я новое слово придумал!) на сканирование/сохранение одной страницы?

Если нет картинок, таблиц, то сканирование + распознание 1 стр. примерно минута в среднем.

Если есть картинки или таблицы то гемора в несколько раз больше, но как правило при сканировании это просто выкидывается.

+ добавление на сайт со всем форматирвоанием около 1-2 минут на страницу.

Явно, что быстрее рерайта в десятки раз, а цена почему-то меньше в 2 раза.

Я считаю, что цена должна кладываться из количества потраченного времени, но у нас почему-то так не принято, качается и дизайна и контетна и пр.

S2
На сайте с 07.01.2008
Offline
611
#17
Solser:
Если нет картинок, таблиц, то сканирование + распознание 1 стр. примерно минута в среднем.
Если есть картинки или таблицы то гемора в несколько раз больше, но как правило при сканировании это просто выкидывается.
+ добавление на сайт со всем форматирвоанием около 1-2 минут на страницу.
Явно, что быстрее рерайта в десятки раз, а цена почему-то меньше в 2 раза.

Всё зависит от книжки. Если бумага плохая и виден текст с обратной стороны, то такого нараспознает, что некоторые абзацы придётся вручную забивать. Если книжка ценная, а переплёт тугой - тоже проблемы. И по любому текст потом надо сверять, бывает буквы путает с другими.

Копирайт по крайней мере интересно писать, а тут тупая работа требующая внимания.

DJ_Petrovich
На сайте с 13.02.2006
Offline
188
#18
Калинин:
Просветите, плз., меня, что может удержать такого продавца от повторной продажи контента?

проданный контент появится в сети и уже не будет уникальным, поэтому продать его повторно не получится, да и какой смысл?

PS на счет "бизнес в интернете всегда на доверии": по большому счету весь бизнес строится на доверии, ибо существует несметное количество схем обхода различного рода договоров, законов и всяких остальных гарантий исполнения чего-либо, и, соответственно, в большинстве случаев, есть возможности "кинуть" клиента, что, понятное дело, сделает из него очень быстро "врага" и может обернуться проблемами не только с деловой репутацией, но и с реальной репой (в смысле морды лица, например), но тем не менее, ни смотря ни на что, всегда были есть и будут люди, готовые жертвовать этими двумя видами реп ради призрачных сиюминутных выгод, поэтому затронутая тема не нова, и вряд-ли что то можно сделать с теми недобросовестными участниками рынка, которые поступают "плохо", кидая тень на всех порядочных людей, пытающихся заработать "копеечку" этим нелегким трудом.

Тонны одноцентового трафика из Директа для ваших сайтов. Настройка - бесплатно! (/ru/forum/779616) Лендинг + Реклама в Яндекс.Директ за 15 минут! (/ru/forum/comment/16213883)
Dyachek
На сайте с 15.12.2007
Offline
128
#19
Solser:

Я считаю, что цена должна кладываться из количества потраченного времени, но у нас почему-то так не принято, качается и дизайна и контетна и пр.

Ты так считаешь, как потребитель этого товара (возможный). С точки зрения продавца это выглядит по-другому: зачем продавать дешевле, если пипл может купить дороже? :)

Тут чистая экономика. Закон спроса и предложения.

Выскажу исключительно своё мнение, извиняйте, кому не понравится:

Почему сейчас на форуме очень мало людей, которые продают сканированный контент? Потому что пипл посчитав, что сканированный контент достаётся почти даром (тупо положить книгу и скопировать текст) не готов переплачивать контентщикам. Только покупатель не в курсе, сколько кругов пота пройдёт этот контент, прежде чем поступит к покупателю в подобном виде. Также в умах потребителей происходят чудеса математики (в два раза меньше времени на сканировку значит в два раза дешевле).

Только не стоит забывать, что чужое время и деньги считать весьма не тактично во-первых, а во-вторых приводит к плохим последствиям.

Рынок контента ничем не отличается от общепринятого понятия рынка в экономике, где основное правило — закон спроса и предложения. Если покупатель по каким-либо причинам не готов платить ту цену, которая не удовлетворяет продавца, то продавец не будет продавать.

Также и наоборот: если покупателя не будет устраивать цена, то он не купит.

Только вот где собака зарыта: Если продавца не устроит цена контента, то ему ничего не мешает купить хост с доменом, поставить фришную CMS и тупо заполнять своим же контентом. Да, он не получит моментальной прибыли, но он будет получать эту прибыль в десятки раз больше только на гораздо более долгом промежутке времени. Что, собственно, сейчас и происходит на этом рынке.

Либо, по своему личному опыту знаю, что находятся люди, которые готовы платить адекватную цену за контент и работать с ним, но дальше аськи они не уходят :)

Так что, покупателям только и остаётся, как заказывать школьникам копирайт по 2$ за тысячу с ошибками: ругаться, колоться, но продолжать заниматься сексом с ёжиками :)

Тема приняла очень интересный оборот. Буду очень рад увидеть аргументированные ответы на моё сообщение. Быть может, сейчас всё поменялось и есть люди, которые готовы платить адекватно за контент? Либо я вообще в корне не прав. Поясняйте. Буду рад увидеть любые аргументированные, адекватные мнения :)

SanchezBoy
На сайте с 06.12.2007
Offline
156
#20

Хочу добавить к Str256

Ещё я встречал проблему, когда книжка больше размера сканера.

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий