АЛГОРИТМИ И ПРОГРАМИ В ТЕКСТООБРАБОТКАТА

(дипломна работа, София, ФМИ, 1995 г.)

2.4.4. Алгоритъм за анализ на текст

Състои се в определяне на границите на поредната дума и предаването им като параметър на analyze_word до достигане на края на текста. След това се създава новият текст, като се поставя сричкопренасящо тире (код 250 от аскитаблицата) на местата, където може да има пренос, с което задачата е решена.

Нека се декларират още три не сложни помощни функции:

unsigned long find_word_end (unsigned long);
// Открива края на текущата дума.

unsigned long find_next_begin (unsigned long);
// Открива началото на следващата дума.

void make_hyphen_in_text ();
// Създава нов текст като поставя кода 250 след местата,
// където може да има пренос.

Описанието на основната функция, която се прилага над текст с дължина n, е:

void analyze_text (unsigned long n)
  {
    unsigned long temp = 0L;
    unsigned long next;
    while (temp < n-2L)
      {
        next = find_word_end(temp);
        analyze_word(temp, next);
        temp = find_next_begin(next);
      }
    pointers_to_hyphen[pp] = 0L;
    make_hyphen_in_text();
  }
    

Този алгоритъм включва в себе си метода на скандирането, но приложен само в определени граници на думата – в границите на дадена морфема. В заключение трябва да се добави, че програмната реализация засега е затруднена от необходимостта да се въведат изброените по-горе речници.

<< назад | отгоре | напред >>

Съдържание

0. Встъпление

1. Увод

2. Сричкопренасяне

2.1. Малко история

2.2. Правила за сричкопренасяне от 1983 г.

2.3. Метод на скандирането

2.4. Алгоритъм на сричкопренасянето по фонетичен и морфологичен принцип

2.4.1. Алгоритъм за откриване на морфема в дума

2.4.2. Алгоритъм за анализ на буква

2.4.3. Алгоритъм за анализ на дума

2.4.4. Алгоритъм за анализ на текст

2.4.5. Други възможности

3. Автоматизирано откриване и отстраняване на грешки в текст

3.1. Дефиниции и понятия

3.2. Често допускани грешки

3.3. Класификация на правилата

3.4. Примерна програмна реализация на локалните правила

3.4.1. Нови дефиниции, променливи, флагове и множества

3.4.2. Таблица на локалните правила

3.4.3. Функции, необходими за реализация на локалните правила

3.5. Глобални правила

3.5.1. Класификация на думите в текст на равнище знакове

3.5.2. Функции, необходими за реализация на глобалните правила

3.5.3. Функции и идеи, които предстоят да бъдат осъществени

4. Някои метрики в текстообработката

4.1. Текстови и шрифтови метрики

4.2. Сложност на текст

4.3. Професионализъм на предпечатната подготовка

4.3.1. Използване на възможностите на програмите чрез дефиниране на различни стилове

4.3.2. Премахване на излишното форматиране

4.3.3. Използване на възможностите за настройка на основните отношения между и в параграфите

5. Заключение

6. Литература

7. Приложениe

7.1. Списък на книгите, върху които са направени експерименти

7.2. Някои статистики и резултати от проведени изследвания