LEEET.net

НОВОЕ НА САЙТЕ

Обзор устро­йства для чте­ния книг iRiver Story: Белая ладья

Обзор устро­йства для чте­ния книг PocketBook 360°

Обзор устро­йства для чте­ния книг Sony Re­ader PRS-600

Добавлен еще обзор устро­йства для чте­ния книг Amazon Kindle 2

Описание тех­но­ло­гии Bluetooth

История компании Canon

Обзор устро­йства для чте­ния книг Amazon Kindle 2

История компании Ama­zon

ABC Amber LIT – кон­вер­тер файлов LIT фор­мата

ShortBook – про­грам­ма для чте­ния книг iPhone

DjVu Do­cu­ment Exp­ress Edi­tor Pro – про­грам­ма для соз­да­ния и про­смо­тра DjVu-до­ку­мен­тов

Немного инфо­рма­ции о се­нсо­рных экра­нах

Fb2Fix & FF Shell – кор­рек­тор fb2-книг с Либ­русе­ка

Русификация устро­йства для чте­ния книг Sony Re­ader PRS-700

STDU Converter – про­грам­ма для кон­вер­тации файлов в фор­мате DjVu или TIFF в PDF

CHM Decoder – про­грам­ма для кон­вер­тации файлов в фор­мате CHM

Macintosh Book Re­a­der – про­грам­ма для чте­ния книг (Win­dows, Linux, Ma­cin­tosh)

µBook Reader – про­грам­ма для чте­ния книг (Windows)

История корпорации Sony

iPhone TextReader – про­грам­ма для чте­ния книг iPhone

Программа Fiction­Book Editor 2.0 – для созда­ния и редак­тирова­ния Fb2 фай­лов

Обзоры и описание устро­йства для чте­ния книг Sony Reader PRS-700

Обзоры и описание устро­йства для чте­ния книг PocketBook 301

Купить PocketBook 301 Plus

Inscenic Smart DjVu – про­грам­ма для чте­ния файлов DjVu (КПК)

Foxit Reader – про­грам­ма чте­ния файлов PDF (Windows)

Программа Yo – пред­назна­че­на для ёфи­ка­ции рус­ских текст­ов (Win­dows)

Программа для чте­ния книг PocketDjVu (Win­dows Mo­bi­le)

Brava Reader – про­грам­ма для чте­ния файлов PDF (Win­dows)

ведение бухучета Ростов

Программы / Редакторы электронных книг / Yo – программа ёфикации русских текстов

Yo – программа ёфикации русских текстов

Разработчик: Vladimir Ivanov (Leningrad)

Статус программы: Freeware

Интерфейс: Русский

Размер файла: 0,4 Mb

Версия: 0936_b2

Система: Windows 95/98/ME/2K/XP/Vista

Формат: FB2, RTF, HTML, TXT


Основное окно программы выглядит примерно так…

«Нужна ли русскому языку буква „Ё“?» — вопрос, страсти вокруг которого кипят, по-видимому, со времён её изобретения Карамзиным (или Дашковой?). Я далёк от экстремизма обоих направлений в этом вопросе, но склоняюсь к тому, что буква эта полезна, а иногда и необходима, так как ведёт к повышению внятности и шумоустойчивости русской письменности. А посему представляю вам свою программу «Yo» («Ё»).

«Yo» предназначена для грамматически корректной замены буквы «е» на «ё» в русских текстах («ёфикации»), а также проверки правильности уже расставленных «ё». Полностью решить эту задачу без участия человека она, разумеется, не может, поэтому работает интерактивно, в сомнительных случаях обращаясь за помощью к вам.

«Yo» работает с текстами в кодировке CP-1251 и, в первую очередь, в формате «Plain text». Существует также возможность читать и записывать файлы в формате «Rich text» (RTF). Однако этот режим протестирован довольно поверхностно, поэтому могут быть проблемы.


Как ёфицировать текст за 5 минут (очень краткая справка)
  1. Скачайте архивы с программой и словарём;
  2. Распакуйте эти архивы в какой-нибудь каталог;
  3. Запустите yo.exe;
  4. Перетащите мышкой в окно программы текст, предназначенный для ёфикации;
  5. Нажмите Ctrl-F9;
  6. В спорных случаях программа будет спрашивать вас, менять ли «е» на «ё». Нажимайте «2», если вы согласны, и «1» — если нет;
  7. Нажмите F2 и сохраните ёфицированный файл под нужным именем.

Если вам этой информации недостаточно — читайте ниже

Более подробное описание

Итак, для работы вы должны скачать саму программу (архив, ~400K) и один из словарей:

  • yo_os_2.130.dat (архив, ~290K) — основной словарь — текущая версия самого большого из существующих, полученного добавлением к словарной базе для скриптов Е. Миньковского (см. ниже) форм слов на «ё» согласно «Толково-словообразовательному словарю русского языка» Т. Ф. Ефремовой (М.: «Русский язык», 2000). Содержит примерно 117 878 слов, в том числе некоторое количество устаревших, диалектных и просторечных. Словарь регулярно пополнялся, его последняя версия — 1.30 от 28.06.2008. Рекомендую вам использовать именно его.
  • yo_ss_2.021.dat (архив, ~87K) — словарь словосочетаний, который используется в режиме «Анализ словосочетаний» (см. ниже). Программа будет работать и без него, однако он, по мысли автора, может повысить качество и уменьшить время ёфикации. Содержит примерно 21 000 словосочетаний.

Авторы словарей пытались, с одной стороны, учесть все возможные варианты написания, а с другой — не отступить от правил современной русской орфографии. Однако всего предусмотреть невозможно, особенно применительно к стихам, текстам с диалектизмами, вульгаризмами, устаревшими словами, и т. п. Кроме того, разумеется, в словарях могут быть ошибки и лакуны. Поэтому обработанные программой тексты не следует рассматривать как тексты, гарантированно не содержащие ошибок в расстановке «е/ё». Если вы хотите получить текст, близкий к идеалу (вообще говоря, недостижимому) в смысле ёфикации, то включайте опцию «Всегда подтверждать замену» и в сомнительных случаях справляйтесь в словарях — например, на сайте www.gramota.ru (хотя и это не всегда помогает).

Замечу также, что словари не нужно рассматривать в качестве нормативных. Сомнения в существовании варианта слова с «ё» иногда решались в его пользу (то есть оно заносилось в словарь со знаком «?»). Таким образом, то, что программа предлагает вам выбрать один из вариантов написания, может не означать, что оба они одинаково грамотны!

Смысл некоторых пунктов меню

«Редактировать»

  • «Копировать в окно словаря» — выделенное слово копируется в «окно новых слов» редактора словарей;
  • «Откат» — отмена последней интерактивной замены.

«Ёфикация»

  • «Ёфицировать с начала текста» — понятно без комментариев;
  • «Ёфицировать с текущей позиции» — аналогично;
  • «Детальная статистико» — показать детальную статистику ёфикации;
  • «Обнулить статистику» — статистика ёфикации сбрасывается в ноль, снимается выделение со всех заменённых букв в тексте;
  • «Сбросить „Всегда Е/Ё“» — при запросе на интерактивную замену вы можете нажать кнопку
  • «Всегда Е» или «Всегда Ё», и программа автоматически будет делать выбранную замену в данной словоформе либо до конца сеанса работы, либо пока вы данным пунктом меню не сбросите умолчания;
  • «Сбор новых Ё» — программа собирает в тексте (начиная с текущей позиции) все слова с Ё, которые не входят в её словарь и вставляет их в окно слов редактора словарей. Команда может быть полезна для обработке текстов или словарей, с помощью которых пополняется текущий словарь.

«Опции»

  • «Всегда подтверждать замену» — запрос на замену буквы выдаётся всегда;
  • «Помечать исправленное» — изменённые буквы помечаются синим цветом;
  • «Быстрая промотка» — при замене окно проматывается только к тем позициям, которые требуют ответа от пользователя;
  • «Проверять расстановку Ё» — если опция включена, то программа пытается меняет как «е» на «ё», так и «ё» на «е», если нет — только первое;
  • «Только бесспорные замены» — игнорируются интерактивные (т.е. требующие ответа от пользователя) замены.
  • При этом считается, что замена «ё» на «е» требует его всегда!
  • «Только интерактивные замены» — режим, обратный предедущему: игнорируются бесспорные замены, выдаются запросы в случаях, когла допускаются варианты и с «ё» и с «е»;
  • «Сохранять в формате RTF» — опция включается автоматически, если загружен файл формата RTF, но её можно включить и вручную. Это удобно, если нужно сохранить информацию о сделанных заменах (и включена опция «Помечать исправленное»);
  • «Заворачивать текст ("Word wrap")» — это удобно при наличии длинных строк в тексте;
  • «Предлагать последний вариант» — если слово уже попадалось в тексте, то при последующих интерактивных заменах в качестве ответа по умолчанию будет предлагаться тот же, что и в предыдущий раз;
  • «Подтверждать операции» — включение запросов на выполнение некоторых операций;
  • «Формат „FictionBook“» — в настоящий момент смысл опции состоит в том, что программа игнорирует текст, расположенный после тэга <BINARY ...> и до конца файла;
  • «Анализ словосочетаний» — режим анализа контекста слова, описанный ниже;
  • «Запоминать последний файл» — в этом режиме программа помнит файл, с которым работала в предыдущую сессию, а также позицию в нём;
  • «Ширина контекста» — количество дополнительных символов, отображаемых спава и слева от изменяемого слова в верхней строке формы запроса (по умолчанию — 20);
  • «Количество строк промотки» — количество строк от изменяемого слова до нижней границы окна (по умолчанию — 2). Подъём строки совпадения над нижней границей окна может помочь при работе со стихами — посмотреть рифму ниже;
  • «Задать шрифт главного окна» — без комментариев.

О словарях

Словарь слов («основной словарь», или ОС, или просто «словарь») — это упорядоченный по алфавиту (при этом «е» и «ё» считаются неразличимыми) список словарных строк и комментариев. Комментарий — это произвольная строка, начинающаяся с «#», программа её игнорирует. Словарная строка — это слово с буквой «ё», состоящее из букв русского алфавита в кодировке CP-1251 (пробелы и знаки препинания не допускаются), к которому могут быть добавлены служебные символы «*» или «?». После слова может стоять знак «?», если допустимы оба варианта - как с буквой «е» так и с буквой «ё» (в этом случае программа попросит подтверждение при замене буквы «е» на «ё»). Перед словом и(или) после него может стоят метасимвол «*», который означает любое (в том числе и нулевое) количество букв. Программа сначала ищет данное слово текста среди слов ОС, не содержащих метасимвола («словоформ»), и только затем — среди слов с метасимволом («правил»).

При модификации ОС рекомендую использовать правила крайне осторожно, так как всегда есть вероятность, что вы чего-то не учли. Например, введя в ОС правило «берём*» и имея в виду слова «берём» и «берёмся», вы, безо всякого на то основания, сообщите программе, что правильно писать «берёменная» :) Поэтому, если у вас есть хотя бы минимальные сомнения — используйте словоформы.

Начиная с версии 0.91 в программу введён режим «Анализ словосочетаний» и соответствующий ему «Словарь словосочетаний» (СС). Словосочетание — это группа из более одного и не более трёх слов* (т. е. последовательностей букв русского алфавита), разделённых небуквенными символами (т. е. любыми текстовыми символами, кроме русских букв) и, быть может, ими начинающаяся или оканчивающаяся (см. примеры в файле yo_ss_2.021.dat). Словосочетания в СС тоже должны быть упорядочены по алфавиту. Обратите внимание на то, что дефис — тоже небуквенный символ, поэтому, например, вопреки правилам русской грамматики, слово «всё-таки», с точки зрения программы, является словосочетанием.

В словосочетании допустим метасимвол «\0», заменяющий любую последовательность цифр.

Если программа нашла в тексте слово, требующее запроса на замену, но это слово входит в словосочетание, присутствующее в СС, то запроса не происходит, а буквы «ё/е» в слове расставляются буквально так, как в соответствующей строке СС. В случае, когда слово входит в несколько словосочетаний, приоритет имеют более длинное, а из одинаковых по длине — то, в котором слово стоит ближе к началу. Например, если в СС присутствуют строки «обо всём» и «всем на свете», то в тексте «забыв обо всем на свете» замены «ё» на «е» в слове «все» не произойдёт.

По умолчанию программа использует основной словарь yo.dat и пустой словарь словосочетаний. Для задания других словарей нужно воcпользоваться командой меню «Загрузить словарь» или «Загрузить словарь словосочетаний».

О регистре слов в словарях

Начиная с версии программы 0.935 в ОС допускается использование слов с первой буквой в верхнем регистре. При этом словарь упорядочивается согласно следующему порядку букв: «АаБб...Е(=Ё)е(=ё)...Яя». Словарная строка, написанная с использованием заглавной буквы, относится только к словам в тексте, первая буква которых тоже большая. Так, строка «Алёша» будет относиться только к словам «Алёша», «АЛЕША» и т.д. (но не «алёша»), тогда как строке «алёша» будут соответствовать любой регистр букв. Программа ищет в ОС сначало слово с заглавной буквой, а если не находит его, то с прописной.

В СС допустимы буквы обоих регистров в любой позиции. При этом, в отличие от ОС. если словосочетание написано с использованием заглавных букв, то в тексте ему соответсвует строка, написанная буквально так же.

О русских фамилиях

Нормы написания фамилий, вообще говоря, гораздо более размыты, чем в случае нарицательных имён. Поэтому при дополнениях и изменениях большого словаря, начиная с версии 1.3, русские фамилии и производные от них почти всегда имеют знак запроса «?». Дело в том, что, скажем, фамилии Ж.И. Алфёрова и Е.И. Пугачёва пишутся через «ё», но никто не поручится, что не существуют вариантов написания этих же фамилий через Е. Исключения могут касаться только известных иностранных фамилий (например, «Гёдель») и популярных русских, алтернативное написание которых кажется мне весьма сомнительным (например, «Семёнов»). Если вас не устраивает подобная ситуация, вы всегда можете использовать кнопки «Всегда Е/Ё» в окне запроса.

Редактор словарей


Не предполагается, что вы будете часто нуждаться в редакторе словарей, поэтому опишу его очень кратко. Редактор словарей вызывается нажатием клавиши F4. Он состоит из «окна словаря» (вверху или слева) и «окна (добавляемых) слов» (внизу или справа).

В редакторе вы можете:

  • Загрузить словарь (F3);
  • Сохранить словарь (F2);
  • Вычесть из загруженного словаря другой (в окне словаря остаются только слова, которые есть в первом словаре и отсутствуют во втором);
  • Сортировать словарь (F8);
  • Удалить дубли из словаря (Ctrl-D);
  • Добавить слово из «окна слов», на котором стоит позиция курсора, в правильное место «окна словаря» (Insert) ;
  • Создать формы слова из основной (Ctrl-Insert) ;
  • Найти следующую ошибку в «окне словаря», начиная с позиции курсора (Ctrl-E);
  • Опция Режим «Словарь словосочетаний» — при установке этой опции словарь считается словарём словосочетаний (в нём допускаются слова с «е» и небуквенные символы);
  • Опция Вести лог новых слов — ведётся файл insert.log, в который заносятся все слова, заносимые из «окна слов» в «окно словаря»;

Команда «Создать формы слова» может быть полезна при массированной вставке новых слов в словарь. Она работает, если в рабочем каталоге программы присутствует файл morphs.dat. Файл описывает правила генерации косвенных форм слова из основной (существительного или прилагательного именительного падежа единственного числа, инфинитива глагола). О формате файла не рассказываю — тот, кому понадобится его редактировать, разберётся сам.

Для генерации форм слова следует:

  1. Подвести курсор к нужному слову в «окне слов»;
  2. Нажать Ctrl-Insert;
  3. Выбрать тип слова из выпадающего списка;
  4. Отредактировать созданные словоформы (среди них могут быть лишние или несуществующие!);
  5. Нажать кнопку «Принять»;


* Если выхотите воспользоваться предлагаемым словарём словосочетаний, то нужно увеличить максимально допустимое количество слов до 5, добавив строку в файл yo.ini:

WordsBufferLength=5


Владимир Иванов, май 2007.



Скачать программу «Yo» v.0936 beta2 (375кБ)

Скачать основной словарь «Yo» (287кБ)

Скачать словарь словосочетаний «Yo» (88кБ)

Скачать оригинальный ОС yo2_13.dat (296кБ)

Скачать небольшую подборку с Gramota.ru (40кБ)

Скачать видоизменённый exe-шник yo.exe (283кБ)

Скачать словогенератор morphs.dat (3кБ)

      © 2008 -2016 LEEET.net