Nogr1k

Рейтинг
31
Регистрация
21.03.2009

Ufgo, пожалуйста.

Импорт Wordpress eXtended Rss (WXR) уже существует. Поддерживаются записи, страницы, рубрики и метки.

Мартовский Заяц:
1. Автодаты у меня проставляются не случайным образом, а по порядку следования статей...

2. Дату публикации изменить в ручную я так и не смог...

Чтож сразу не сообщили, а мучались? :) Теперь все работает корректно. Даты публикации устанавливаются случайно из заданного диапазона.

Мартовский Заяц:
3. Есть в программке возможность задавать подрубрики и подподрубрики? И подподподрубрики?

Пока нет и, вероятно, не скоро появится. Это связано с грядущей реорганизацией внутренней структуры хранения данных. Появится возможность использования вложенности страниц и лучшая поддержка CMS Simple подобных движков. Будет разделение записей на "посты" и "статьи".

Мартовский Заяц:
4. Планируется ли возможность импорта в blogger?

Если найдутся еще желающие, то да.

Мартовский Заяц:
5. Возможна ли автоматическая организация прямой внутренней линковки (метки считаю косвенной внутренней линковкой). Мне любопытно, возможно ли это технически, или это только после импорта непосредственно в WP? В принципе, если организовать автоматическую расстановку ссылок, то можно составить список на сам сайт, но возможно ли это, если адрес сайта еще не существует?

Технически возможно, но достаточно сложно. В каждой CMS используется своя схема (ЧПУ) URL и предугадать адрес новой страницы не всегда возможно. Хотя в случае с Wordpess будет проще.

Записал в TODO, попробуем реализовать.

Мартовский Заяц:
6. Нет ли у вас желания прикрутить возможность написания комментариев к постам.

Неплохая идея. Уже в списке :)

Спасибо за активное тестирование.

Качаем исправленный билд

seovrs:
Успехов вам!

Спасибо! И Вам успехов при создании сайтов с помощью textKit :)

dorws:
А что то не запускается программа! Пишет что ошибка инициализации.

Для работы textKit требуется установленный Microsoft .NET Framework версии не ниже 2.0.

Если при попытке запуска программы вы получаете ошибку типа "Ошибка при инициализации приложения", то вам необходимо скачать и установить необходимые файлы:

Скачать .NET Framework 2.0

Rchernovol, пока имеются жуткие проблемы с производительностью автометок. Даже небольшой словарь и пара десятков записей вводят систему в "ступор" на непрелично долгий промежуток времени. После необходимой оптимизации кода и проверок автометки станут доступными.

Мартовский Заяц:
В том-то и дело, что из ворда. HTML-код ворда во всех странах уже давно признан разновидностью порнографии, но уж больно я привык работать с текстом в ворде. Если убрать <p> из списка тегов, для которых очищаются атрибуты, то выравнивание никуда не пропадает, но в коде все равно остается много ерунды. В принципе, терпимо.

На самом деле, решение гораздо проще. Нужно только проявить смекалку :) Например, если для параграфов требуется выставить выравнивание по ширине, то в списке поиска/замен пишем заменить '<p>' на '<p align="justify">'. При этом нужно руководствовать следующим. При работе парсера HTML в первую очередь удаляются теги "Удалять все теги, кроме указанных", затем производится очистка от Ворд и очистка атрибутов, после чего устраненяются ошибки типографики, и, наконец, поиск/замена. В следующих версиях постараемся внести изменения, избавляющие от подобных "плясок с бубном" :)

Мартовский Заяц:
Можно, кстати, попробовать какую-нибудь утилиту для чистки html - тоже вариант, хотя по мне проще смириться с некоторым количеством лишних атрибутов в теге <p>.

Как вариант, могу посоветовать сервис WordOff (на начальной стадии разработки textKit именно он использовался для очистки от мусора ворда)

Мартовский Заяц:
Про картинки - это я до кучи сказал, сам предпочитаю ручками вставлять и alt прописывать.

Зря, встроенный редактор неплохо с этим справляется. Кстати, очень скоро будет обновление, позволяющее избежать проблем с существующими картинками в HTML.

Мартовский Заяц:
А вот такой вопрос: вы не планируете автоматическую вставку ссылок по списку анкоров и urlов.

Записал, отличная идея!

Мартовский Заяц, спасибо за дельные советы!

Ждем нового билда. Уже сегодня будет выложено обновление с некоторыми изменениями.

vikuz, по сути, так и есть. Основным назначением textKit остается импорт контента из одного источника и преобразование в другой. В будущем мы расширим функционал для обработки самого текста (в т. ч. визуальный редактор) и массовой операции над записями (автоматическая вставка картинок, seo анализ и оптимизация текста, проверка на уник в ПС).

Планов достаточно много (только на данный момент в TODO-листе имеется около 30 пунктов) и, в принципе, скорость их реализации будет зависеть от активности тестеров и пользователей textKit.

Мартовский Заяц:
В процессе импорта выравнивание теряется при чистке кода. Попытки манипулировать списком неудаляемых тегов провалились. В редакторе возможности выровнять текст нет. Выставлять выравнивание вручную тегами для одной статьи еще ничего, для нескольких десятков или сотен - лучше застрелиться.
Неплохо было бы, если бы программа умела брать картинки прямо из HTML. То бишь, если в HTML-файле есть картинки, они переносились бы в _images автоматом (лучше, если такая возможность будет опциональна). А то, если уже есть файл с кучей вставленных картинок, перегонять их по одиночке в код очень муторно.

Если статьи не были сохранены из ворда, и в HTML нет лишнего мусора, то можно легко избежать данной проблемы. Во время импорта HTML, отключите опцию "Удалять ненужные теги (Word)". При этом все атрибуты тегов останутся без изменений. К тому же, даже при включенной опции "Удалять ненужные теги (Word)" можно избежать проблемы, если в настройках программы удалить необходимые элементы из списка тегов, для которых очищаются атрибуты.

Копирование рисунков в папку "_images" происходит только во время экспорта и только для картинок, src которых начинается с "file://localhost/". Советую обратить внимание на возможность поиска и замены текста во время парсинга HTML.

Если ни одно из вышеперечисленного не помогло, то вышлите мне, пожалуйста, пример исходного HTML файла (до парсинга) в личку.

На самом деле, парсер довольно сыроват и недостаточно гибок, мы постоянно улучшаем его возможности и производительность.

Мартовский Заяц:
Я не уверен, что кому-нибудь кроме меня это будет полезно, хотя я бы очень обрадывался. Позвольте, я объясню подробнее, чтобы всем стало понятнее (может еще кому захочется:).
...

Ваша идея ясна, спасибо. В принципе, реализовать такую возможность можно, но на это понадобится время, которого, к сожалению, очень не хватает. Возможно, в будущих версиях textKit появится подобная функция, а если она окажется востребованной, то появится раньше. Тем не менее, я постараюсь придумать, как упростить Вам жизнь в следующих релизах :)

Спасибо за интерес к разработке!

Nogr1k добавил 14.04.2009 в 02:31

Nogr1k:
Для работы приложения требуется установленный Microsoft .NET Framework не ниже 2.0 версии. Проверьте его наличие и при необходимости установите (скачать можно с сайта Microsoft).

Вот ссылочка для скачивания (22.4 МБ).

dimmu-borgir, для работы приложения требуется установленный Microsoft .NET Framework не ниже 2.0 версии. Проверьте его наличие и при необходимости установите (скачать можно с сайта Microsoft).

Мартовский Заяц:
Однако, как я ее не крутил, так и не смог найти функцию автоматической разбивки материала на рубрики и категории. А это ведь самое вкусное. Я так понял, этой функции пока нет? Или я плохо искал... Вот смотрите: у меня есть вордовский файл, в котором мирно лежат, скажем, тридцать статей. Хотелось бы, чтобы программа сама разбила файл (желательно тот же вордовский, без пересохранения в хтмл) на статьи и рубрики. По признаку размера шрифта, скажем, - как это обычно реализовано в подобных софтинах. Такого ведь нет еще в программе? И не планируется пока, как я понимаю?

Такая возможность есть, видимо мы недостаточно осветили это в мануале. Уже исправили.

Итак, для правильной разбивки нужно форматировать документ подобно тому, как это делается, скажем, в WPT. Т. е. название рубрики задается заголовком 1, а за ним должны следовать записи, начинающиеся с заголовка 2. Оформленный таким образом документ сохраняется в HTML и импортируется в textKit. Вы можете скачайть новый дистрибутив, в нем будет вложен файл примера (html).

Поддержка документов ворд (docx, doc) будет включена позже.

Мартовский Заяц:
Визуального редактора, действительно, не хватает. С самим кодом работать не особо влом, но, как всегда, хочется удобств.

Визуального редактора нет (но будет), а пока улучшается простой редактор. На данный момент упрощена работа с наиболее часто используемыми тегами (img, a, b, i, <!--more-->). Если хотите предложить другое или улучшить существующее - велком :)

Мартовский Заяц:
Я много вожусь с размноженными статьями, и мне давно снится чудесная программа, которая могла бы взять группу файлов с размноженными статьями (в каждом файле отдельная генерация, штук 500, к примеру) и собрать из них заданное количество файлов импорта для wordpress (по одной статье из каждого файла, итого пакет статей). Я понимаю, что оно трудно осуществимо и мало кому нужно (кроме меня :)), но идея такая имеется. Для множителей могло бы быть крайне полезно.

Такая возможность пока не рассматривалась, спасибо за предложение. Подумаем как ее реализовать. Если Вам это интересно, то можете связаться со мной любым доступным способом для обсуждения такой функции.

minSEO:
Экспорт в DLE не планируется часом?

Планируется и обязательно будет включен.

Nogr1k добавил 13.04.2009 в 07:05

Фух. Вылаживаем новый билд textKit!

Последние изменения:

  • добавлен экспорт в Zebrum Lite (поддерживаются теги, дата публикации и картинки)
  • файлы проекта и настройки сохраняются в xml файлы (добвлено для совместимости со следующими версиями)
  • импорт простых txt файлов
  • улучшена работа редактора с картинками (добавлена поддержка width, height)
  • поддержка drag&drop для импортируемых файлов
  • запуск с командной строки (теперь можно ассоциировать файлы проекта с утилитой)
  • другие мелкие изменения (устранены некоторые баги, обновлено окно настроек)

Продолжается работа над автометками и добавлением новых форматов.

Пробуем

1 2345 6
Всего: 51