Бесплатная утилита для импорта контента в CMS

[Удален]
#61

Напишу тут, поскольку на сайтматике не поддерживается форматирование.

Типа багрепорт ;)

Замечено при импорте html-файла.

Если после Н1 идет текст (не Н2!) или хотя бы любой другой тег (пустой параграф, например), то получается несколько рубрик (по Н1) и заголовки постов (по Н2). Однако заголовком первого поста в последующей рубрике становится заголовок предыдущей рубрики.

Если же перед первым Н1 идёт другой тег (бр, параграф и тд), то первым постом становится "! Безымянный"

Те примерно следующее.

Рубрика1
! Безымянный
Заголовок1
Заголовок2
Заголовок3
Заголовок4


Рубрика2
Рубрика1
Заголовок1
Заголовок2


Рубрика3
Рубрика2
Заголовок1
Заголовок2
Заголовок3

Образец файла:


<p>&nbsp;</p>
<h1>Рубрика1</h1>
<p>некоторый текст<p>
<h2>Рубрика1-Заголовок1</h2>
<p>некоторый текст<p>
<h2>Рубрика1-Заголовок2</h2>
<p>некоторый текст<p>
<h1>Рубрика2</h1>
<p>некоторый текст<p>
<h2>Рубрика2-Заголовок1</h2>
<p>некоторый текст<p>
<h2>Рубрика2-Заголовок2</h2>
<p>некоторый текст<p>

Особенно это неприятно, когда делатся через импорт из Ворда2003 в HTML. Поскольку перед Н1 Ворд вставляет кучу мусора, который программа чистит, но при этом получается, что перед Н1 имеются "лишние теги" и первым становиться пост "! Безымянный", хотя это самый первый Н1 (до него в тексте ничего нет).

И еще - не все теги из Ворда чистятся-вырезаются. Например, остались конструкции вида

<!--[if gte vml 1]> 

и
<img src="image.jpg" v:shapes="_x0000_i1107">

Если первую можно удалять автоматом, просто прописать в программе замену, то для второй без регекспов не обойтись (цифры меняются). :(

[Удален]
#62

Отличная программка! Спасибо!. Ждем выхода финал версии.

Старина
На сайте с 24.10.2008
Offline
100
#63
SeoNizator:
Напишу тут, поскольку на сайтматике не поддерживается форматирование.

Типа багрепорт ;)
Замечено при импорте html-файла.

Если после Н1 идет текст (не Н2!) или хотя бы любой другой тег (пустой параграф, например), то получается несколько рубрик (по Н1) и заголовки постов (по Н2). Однако заголовком первого поста в последующей рубрике становится заголовок предыдущей рубрики.
Если же перед первым Н1 идёт другой тег (бр, параграф и тд), то первым постом становится "! Безымянный"

Это не совсем баг, а скорее "фишка" программы, которую надо доработать.

Сделано для того, чтобы "лишний" контент не терялся, если подготовка текста была произведена не по правилам.

То есть:

<p>текст</p>

<h1>Рубрика1</h1>

<p>некоторый текст<p>

<h2>Рубрика1-Заголовок1</h2>

<p>некоторый текст<p>

<h2>Рубрика1-Заголовок2</h2>

<p>некоторый текст<p>

<h1>Рубрика2</h1>

<p>некоторый текст<p>

<h2>Рубрика2-Заголовок1</h2>

<p>некоторый текст<p>

<h2>Рубрика2-Заголовок2</h2>

<p>некоторый текст<p>

Этот текст не будет потерян - потому и создаются посты с безымянными названиями.

Но вот если в этих местах просто тэги, такого не должно случатся.

Спасибо, исправим :)

SeoNizator:

И еще - не все теги из Ворда чистятся-вырезаются. Например, остались конструкции вида
<!--[if gte vml 1]> и <img src="image.jpg" v:shapes="_x0000_i1107">
Если первую можно удалять автоматом, просто прописать в программе замену, то для второй без регекспов не обойтись (цифры меняются). :(

Надо доработать парсер, спасибо.

Была мысль создать "Поиск и замену" по регулярным выражениям, но, возможно, в будущем.

S
На сайте с 02.09.2008
Offline
12
#64

Огромное спасибо за полезную программу!

в тему о метках: ИМХО, было бы очень полезно, если бы можно было в самом исходном(импортируемом) файле к каждой статье можно было прописать метки, оформив их, допустим, через h3.

Мне (думаю и не только), например, если будет такая возможность, и автометки не понадобятся :)

Рерайт / копирайт. Цены - 0,8 / 3,5 у.е. соответственно. Качество и скорость - главное в моей работе. 555-042-025
D
На сайте с 27.04.2006
Offline
26
#65

Отличая программка, но нашел баг - нету на сайте проекта кнопки "Donate".

Сделайте, плиз.

Хочу внести и свою лепту в создание.

Старина
На сайте с 24.10.2008
Offline
100
#66

Очередное обновление программы textKit.

Что нового:

  • Программа теперь поддерживает два вида записей: посты и страницы.
  • Неограниченная вложенность рубрик и страниц.
  • Редактор текста добавлена кнопка вставки тэга <p>. Если хотите разбить параграф на два, то просто ставим курсор в нужное место и жмём кнопку P. textKit всё сделает сама )
  • Улучшен парсер html/word. Чистит теперь всё (спасибо SeoNizator-у)
  • Исправлен баг с появлением пустых рубрик и постов. Пустые тэги теперь удаляются.
  • Добавлена кнопочка "Добавить рубрику" и на клавиатуре Del теперь работает :)
  • При замене текста (в парсере html) в поле "Заменить текст" что-то есть, а поле "На следующий" пустое, то происходит простое удаление введенного теста.

Хочется пояснить про посты и страницы.

Поддержка страницы включена для совместимости с "неблоговыми" движками, как и их вложенность.

Поэтому прошу не пытаться вложить пост в страницу, не получиться.

Если хотите добавить новый пост, то выделяем нужную рубрику и жмём кнопку.

Если хотите добавить страницу, то убераем выделение со всех рубрик и добавляем страницу.

Вложенность поддерживается только для страниц.

Важно!

Старый файл с настройками не совместим с новой версией. Позаботьтесь о сохранности настроек.

А теперь можно и скачать ;)

Как обычно, здесь: http://textkit.ru/download/

Старина добавил 05.05.2009 в 19:32

SSinyak:
Огромное спасибо за полезную программу!
в тему о метках: ИМХО, было бы очень полезно, если бы можно было в самом исходном(импортируемом) файле к каждой статье можно было прописать метки, оформив их, допустим, через h3.
Мне (думаю и не только), например, если будет такая возможность, и автометки не понадобятся :)

И Вам спасибо!

Если эту идею поддержит ещё кто-то, то пожалуйста. Создавайте тему здесь. Проголосуют, сделаем.

Denim:
Отличая программка, но нашел баг - нету на сайте проекта кнопки "Donate".
Сделайте, плиз.
Хочу внести и свою лепту в создание.

Планируется платная версия программы. Если станете нашим клиентом, то тем самым и внесете свою лепту :)

[Удален]
#67
Старина:
Очередное обновление программы textKit.
Исправлен баг с появлением пустых рубрик и постов. Пустые тэги теперь удаляются.

Не совсем.

В общем, грязный код Ворда (Для удобства восприятия нужное выделил жирным):


<body lang=RU style='tab-interval:35.4pt'>

<div class=Section1>

<h1>Рубрика1</h1>

<p class=MsoNormal><o:p>&nbsp;</o:p></p>

<p class=MsoNormal><!--[if gte vml 1]><v:shapetype id="_x0000_t75" coordsize="21600,21600"
o:spt="75" o:preferrelative="t" path="m@4@5l@4@11@9@11@9@5xe" filled="f"
stroked="f">
<v:stroke joinstyle="miter"/>
<v:formulas>
<v:f eqn="if lineDrawn pixelLineWidth 0"/>
<v:f eqn="sum @0 1 0"/>
<v:f eqn="sum 0 0 @1"/>
<v:f eqn="prod @2 1 2"/>
<v:f eqn="prod @3 21600 pixelWidth"/>
<v:f eqn="prod @3 21600 pixelHeight"/>
<v:f eqn="sum @0 0 1"/>
<v:f eqn="prod @6 1 2"/>
<v:f eqn="prod @7 21600 pixelWidth"/>
<v:f eqn="sum @8 21600 0"/>
<v:f eqn="prod @7 21600 pixelHeight"/>
<v:f eqn="sum @10 21600 0"/>
</v:formulas>
<v:path o:extrusionok="f" gradientshapeok="t" o:connecttype="rect"/>
<o:lock v:ext="edit" aspectratio="t"/>
</v:shapetype><v:shape id="_x0000_i1025" type="#_x0000_t75" style='width:515.25pt;
height:403.5pt'>
<v:imagedata src="img/image001.png" o:title="000000F1"/>
</v:shape><![endif]--><![if !vml]><img width=687 height=538
src="img/image002.jpg" v:shapes="_x0000_i1025">
<![endif]></p>

<span style='font-size:12.0pt;font-family:"Times New Roman";mso-fareast-font-family:
"Times New Roman";mso-ansi-language:RU;mso-fareast-language:RU;mso-bidi-language:
AR-SA'><br clear=all style='mso-special-character:line-break;page-break-before:
always'>
</span>

<p class=MsoNormal><o:p>&nbsp;</o:p></p>

<h1>Рубрика2</h1>

<span style='font-size:12.0pt;font-family:"Times New Roman";mso-fareast-font-family:
"Times New Roman";mso-ansi-language:RU;mso-fareast-language:RU;mso-bidi-language:
AR-SA'><br clear=all style='mso-special-character:line-break;page-break-before:
always'>
</span>

<p class=MsoNormal><o:p>&nbsp;</o:p></p>

<h2>Заголовок поста</h2>

Даёт


Рубрика1
!Безымянный

Рубрика2
Рубрика1
Заголовок поста

В безымянном как и ожидается - картинка, в заголовке поста "Рубрика1" - тег <br />

В общем, как мне кажется, логика нарушена из-за неоднозначности поведения рубрик в разных ЦМС.

Я имею ввиду, что в ВП рубрика (название рубрики) не содержит текста (а только статьи), а в зебре - рубрика содержит свой текст. И вложенные статьи уже само собой.

ИМХО, должна быть опция в случае, если после Н1 идёт контент (а не сразу Н2) - делать названия постов=названию рубрики.

Ещё баги и замечания:

1. После удаления\добавления поста\рубрики фокус теряется и происходит прокрутка всего дерева постов вниз. Пост при этом вставляется последним в рубрике, где был фокус.

2. Хоткеи не все работают (Ф2 и Ф5, например нет). Так ожидаемого (и обещанного) контекстного меню почему-то не :(

3. Перемещение (изменениия порядка) статей\постов\рубрик не работает

4. Опечатка: настройки-общие-"улалять все теги, кроме..."

5. Картинки в визуальном просмотре не отображаются, если не прописан полный путь.

А для Зебры, так там вообще нужно делать отдельную настройку для картинок и прочих внешних файлов (~/ или ~/img или ... ).

sydoow
На сайте с 22.01.2008
Offline
90
#68

Давно увидел программу, но попробовать скачал только сегодня.

ОЧЕНЬ нравится;)

Не хватает чтобы сама заливала на ВП ;)

БУРЖ дейтинг - ТОП конверт! (https://adverten.com/r/eosxamubb)
[Удален]
#69

В общем насчёт

SeoNizator:
В общем, как мне кажется, логика нарушена из-за неоднозначности поведения рубрик в разных ЦМС.
Я имею ввиду, что в ВП рубрика (название рубрики) не содержит текста (а только статьи), а в зебре - рубрика содержит свой текст. И вложенные статьи уже само собой.
ИМХО, должна быть опция в случае, если после Н1 идёт контент (а не сразу Н2) - делать названия постов=названию рубрики.

я немного погорячился ;)

Из-за нововведений - посты-страницы, я сразу не разобрался, что есть что и как оно работает.

Пока продолжаю разбираться.

Как при импорте файла(ов) указать программе как нужно формировать: по рубрикам-постам или по страницам (в тч вложенным)? Точнее по первому понятно (Н1, Н2), а каков должен быть формат исходного файла, чтобы по-странично формировалось?

N1
На сайте с 21.03.2009
Offline
31
#70
SeoNizator:

Как при импорте файла(ов) указать программе как нужно формировать: по рубрикам-постам или по страницам (в тч вложенным)? Точнее по первому понятно (Н1, Н2), а каков должен быть формат исходного файла, чтобы по-странично формировалось?

Пока никак. В ближайшем времени добавяться расширинные настойки HTML парсера, благодаря чему можно будет указывать каким образом воспринимать заголовки.

Nogr1k добавил 06.05.2009 в 14:17

sydoow:
Давно увидел программу, но попробовать скачал только сегодня.
ОЧЕНЬ нравится;)
Не хватает чтобы сама заливала на ВП ;)

Рады стараться :)

Приглашаю оставить предложение в системе отзывов и предложений.

Nogr1k добавил 06.05.2009 в 14:43

SeoNizator:



Рубрика1
!Безымянный

Рубрика2
Рубрика1
Заголовок поста



В последнем билде стало так:


Рубрика1
Рубрика1

Рубрика2
Рубрика2
Заголовок поста

От пустых постов с <br/> пока не избавиться, разберусь.

SeoNizator:

Ещё баги и замечания:
1. После удаления\добавления поста\рубрики фокус теряется и происходит прокрутка всего дерева постов вниз. Пост при этом вставляется последним в рубрике, где был фокус.
2. Хоткеи не все работают (Ф2 и Ф5, например нет). Так ожидаемого (и обещанного) контекстного меню почему-то не :(
3. Перемещение (изменениия порядка) статей\постов\рубрик не работает
4. Опечатка: настройки-общие-"улалять все теги, кроме..."
5. Картинки в визуальном просмотре не отображаются, если не прописан полный путь.
А для Зебры, так там вообще нужно делать отдельную настройку для картинок и прочих внешних файлов (~/ или ~/img или ... ).

1. Частично устранено, также исправлена проблема с прокруткой в визуальном просмотре.

2. Контекстное меню будет обязательно.

3. В разработке.

4. Спасибо, поправил.

5. В разработке.

Касательно зебры. Над картинками поработаем, а для экспорта статей/рубрик будут введены дополнительные настройки.

После введения вложенности страниц, перетаскивание страницы в дочернюю ей приводит к зависанию приложения. Исправлю, но пока будьте осторожнее.

Промокод TKAJI (http://textkit.ru/buy/?code=TKAJI) на покупку TextKit со скидкой для форумчан.

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий