Нужна программа для обработки текста.

123
Dos3
На сайте с 07.01.2011
Offline
363
#11
SeVlad:
не тупи - думай!

думал, но так и не понял, поэтому и спросил :)

M
На сайте с 10.06.2011
Offline
32
#12
Задача ТСа приблиз. такая:
1. Найти кол-во пробелов между точками\воскл-вопрос. знаками\троеточиями\етс.
2. Поделить это кол-во пополам, округлить до целого.
3. Заменить этот (по счёту) пробел на точку+пробел.
4. Удалить символы перед точкой, если они не буква или цифра (знаки препинания и тп)
5. Удалить символы после точки+пробел, если они не буква или цифра.
6. Установить верхний регистр след символа после точки+пробел.


Зы. MCRinat, я готовой софтины не знаю, но по предложному алгоритму любой начинающий кодер сможет написать.

Алгоритм верный.

А сколько будет стоит написание такой программы?(ну примерно хотя бы)

SeVlad
На сайте с 03.11.2008
Offline
1609
#13
Dos3:
но так и не понял, поэтому и спросил

ууу... стакан наполовину полный или наполовину пустой?

Пробел - это однозначный разделитель между словами в предложении - это не ясно?

Ну ОК, ещё раз:

SeVlad:
слово - это набор символов (онли букв, цифр и дефис) ограниченный пробелами и\или некоторыми знаками препинания и\или началом строки.

Иначе говоря - для того чтобы определить СЛОВО, нужно вначале найти его ОГРАНИЧИТЕЛИ. Вот и думай что легче - найти один пробел или перебрать кучу правил.

Понятно теперь?

Делаю хорошие сайты хорошим людям. Предпочтение коммерческим направлениям. Связь со мной через http://wp.me/P3YHjQ-3.
Dos3
На сайте с 07.01.2011
Offline
363
#14

работает вроде


<?php
$file = str_replace("\r\n","",file_get_contents("text.txt"));
$file = preg_replace("#([.!?])#","$1<>",$file);
$arr_file = explode("<>",$file);
foreach($arr_file as $val)
{
$arr_slov = explode(" ",$val);
$ch=count($arr_slov);
$ceil = ceil($ch / 2);
for($i=0;$i<$ch;$i++)
{
if($i==$ceil)$result .= $arr_slov[$i].". ";
else if($i==$ceil+1)$result .= ucwords($arr_slov[$i]." ");
else $result .= $arr_slov[$i]." ";
}
file_put_contents("result.txt",$result."\r\n", FILE_APPEND);
$result="";
}
?>
Newmanseo
На сайте с 02.02.2010
Offline
71
#15

найди нуль дорген пандора бокс - умеет делить по запятым. Я делал так - мешап перевода с английского + копипаст, затем пандорой стыковка по запятым. Яндекс хорошо кушает такое говно. А что делать!!!? К сожалению сайты на которых уникальные купленные статьи он даже в индекс брать не хочет.

Сгенерировать и импортировать.
Dos3
На сайте с 07.01.2011
Offline
363
#16
SeVlad:
нужно вначале найти его ОГРАНИЧИТЕЛИ

считать то их зачем ?

SeVlad:
Понятно теперь?

нет(

SeVlad
На сайте с 03.11.2008
Offline
1609
#17
Dos3:
считать то их зачем ?

ты правда тупой или прикидываешься?

кол-во пробелов = кол-во слов-1

Dos3:
нет(

тогда ничем боле помочь не могу.

.:nbd:.
На сайте с 04.11.2008
Offline
98
#18

Не совсем то, но примерно можно сделать так:

1 Качаем PSPad (бесплатный текстовый редактор);

2 Открываем документ;

3 Поиск->Заменить;

4 Меняем запятые на точки;

5 Формат->Регистр->Как в предложениях;

На выходе имеем текст разбитый на предложения по запятым, каждое новое предложение начинается с заглавной буквы.

Палю тему Дорген (/ru/forum/439165) + кеи + контент (http://datarama.biz/) + еще немного кеев и скриптов (http://amazingsoftware.ru/) = $$$ Мы делаем доры, а не пишем романы (c) один Дима рефка dino_spomoni (http://goo.gl/w62v3)
Т
На сайте с 23.09.2011
Offline
9
#19
MCRinat:
Алгоритм верный.
А сколько будет стоит написание такой программы?(ну примерно хотя бы)

20 баксов устроит? Могу сделать.

Самый важный совет: "Не слушай тупых советов"
W
На сайте с 10.05.2009
Offline
114
#20
SeVlad:
недостаточно.

Задача ТСа приблиз. такая:
1. Найти кол-во пробелов между точками\воскл-вопрос. знаками\троеточиями\етс.
2. Поделить это кол-во пополам, округлить до целого.
3. Заменить этот (по счёту) пробел на точку+пробел.
4. Удалить символы перед точкой, если они не буква или цифра (знаки препинания и тп)
5. Удалить символы после точки+пробел, если они не буква или цифра.
6. Установить верхний регистр след символа после точки+пробел.


Зы. MCRinat, я готовой софтины не знаю, но по предложному алгоритму любой начинающий кодер сможет написать.

Алгоритм реальное гавно, сразу видно что его автор не разу не програмист... Зачем считать количество пробелов то?

Не проще ли сделать експлод по пробелу а потом подсчитать количество елементов масива?

123

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий