Рассылки Subscribe.Ru
Семинары, тренинги и курсы Русской Школы Управления
Консалтинговая группа "Лекс": Каждый шаг выверен ...

Экономическая теория


Лингвистический анализ гистограмм экономических факторов

Лингвистический анализ гистограмм экономических факторов
 
Недосекин А.О., ст. консультант Siemens Business Services, к.т.н.
Фролов С.Н., экономист Регионального Агентства содействия инвестициям Нижегородской области
 
 
При решении задач экономического анализа очень часто встает вопрос о качественной интерпретации тех или иных уровней параметров. Например, финансовому директору компании докладывают: «у нас оборачиваемость активов 0.6». Сразу напрашивается вопрос, много это или мало. Естественно: лингвистическая оценка действует на человека как внятный сигнал и наилучшим образом побуждает его принимать решения.
 
Но, чтобы провести достоверную лингвистическую оценку уровня параметров, надо сделать, по крайней мере, две вещи:
 
  1. Выбрать лингвистическую шкалу для оценки. «Много/мало» - это простейшая бинарная шкала (сразу вспоминается сцена с аптекарем из «Неуловимых мстителей», испытывающим бомбы); «Много – средне – мало» - это тринарная шкала. Очень часто применяется пенташкала (пятиуровневый классификатор) «Очень низкий (ОН) – Низкий (Н) – Средний (Ср) – Высокий (В) – Очень высокий (ОВ)». Шкалы более 7 состояний не популярны в народе, и это правильно: рассеивается внимание, и все начинает походить на бесконечнозначную логику.
  2. Собрать всю необходимую информацию для лингвистической оценки. Сюда относятся количественные данные, собранные по группе однотипных объектов наблюдения, а также дополнительные закономерности, присущие объектам исследования, которые могут оказать влияние на оценку.
 
Например, для качественной оценки уровня ликвидности предприятия, необходимо собрать статистическую информацию по аналогичным предприятиям за данный сравнительно небольшой период наблюдения (чтобы соблюсти условие статистической однородности). Одновременно необходимо руководствоваться закономерностями, присущими объектам финансового анализа. Например, интуитивно ясно, что когда чистый оборотный капитал компании отрицательный, то это плохо (актуальный пример - «ЮКОС», консолидированная отчетность за 1 кв. 2003 года: краткосрочные обязательства – 108 млрд. руб., оборотные активы – 54 млрд. руб. Данные [1]). Также существуют всевозможные нормативы. Например, считается «нормальным», когда коэффициент автономии предприятия больше 0.5, коэффициент обеспеченности оборотных активов собственными средствами – больше 0.1, а коэффициент маневренности – больше 0.5. Применительно к кредитным учреждениям ряд нормативов (ликвидности, достаточности капитала и т.д.) установлен Центробанком РФ и имеет силу закона.
 
            Но, как не существует общих рецептов достижения благосостояния, так и не может существовать жестких однотипных финансовых рамок для всех предприятий, характеризующихся различным положением на рынке, состоянием бизнеса и т.д. То, что считается нормальным в общем смысле, может оказаться совершенно ненормальным в конкретном частном случае. Например, предприятие постперестроечного образца, прошедшее принудительную приватизацию, имеет на своем балансе огромное количество неликвидных активов (морально устаревшее оборудование, требующие капремонта задания и т.д.). Однако оно добросовестно переоценивает эти активы и в результате формально выглядит вполне пристойно (нормальная финансовая автономия, например, с уровнем 0.5). Однако при детальном исследовании выясняется, что для покрытия задолженностей в случае банкротства соотношение ликвидационной цены предприятия и оценки его собственных средств по балансу составляет не более чем 1:10. Поэтому первоначальная «нормальность» в этом случае совершенно редуцируется, уступая место обоснованной тревоге.
 
Также целый пучок проблем связан с исходными данными для лингвистического анализа. Во-первых, трудно выполнить условие статистической однородности. Применительно к развитым странам однородность выборки достигается довольно легко. Так, 9000 корпораций США, чьи акции котируются на бирже, подразделены на 14 секторов и 31 индустриальную группу в составе этих секторов [2]. И в этом случае можно добиться однородности хотя бы на уровне секторов. В России ситуация принципиально иная. Есть некоторое количество корпораций (несколько десятков), чьи акции регулярно торгуются на российских биржах. Все остальные компании, в силу своей недоразвитости или из-за отсутствия желания привлекать средства на рынке (делясь контролем при этом), составляют подводную часть айсберга. И это как бы две разные экономики, перемешивание которых в анализе проблематично.
 
Во-вторых, подлежит дополнительному исследованию вопрос, можно ли объединять при анализе данные, относящиеся к различным временным горизонтальным срезам наблюдения. Соблазн учитывать разновременные данные совместно возникает там, где количественных данных за один период времени для полноценного анализа не хватает. И, несмотря на то, что формально статистическая однородность уже не соблюдена, все равно (для случаев, когда не произошло чего-либо экстраординарного со страной, по которой проводится исследование) эти данные могут оказаться представительными для качественных выводов на их основе. Например, посткризисные годы (2001 – 2003) могут считаться однородными (примерно одинаковый уровень инфляции и темпов роста ВВП). Соответственно, объем статистики, рассматриваемой совместно, возрастает втрое.
 
В свое время, чтобы снять вышеуказанные проблемы, Недосекиным в [3] было введено понятие квазистатистики. Квазистатистика – эта выборка наблюдений из их генеральной совокупности, которая считается недостаточной для идентификации вероятностного закона распределения с точно определенными параметрами, но признается достаточной для того, чтобы с той или иной субъективной степенью достоверности обосновать закон наблюдений в вероятностной или любой иной форме, причем параметры этого закона будут заданы по специальным правилам, чтобы удовлетворить требуемой достоверности идентификации закона наблюдений.
 
Все сводится к тому, что, если имеет место квазистатистика факторов, вероятностного распределения в классическом смысле на ее основе нам построить не удастся. Однако сделать качественные выводы – и, в частности, произвести лингвистический анализ входных данных, - мы сможем.
 
Пусть мы договорились о том, что есть ряд однотипных интервалов анализа (например, кварталов или их финальных дат в пределах последних 2 – 3 лет). Для каждого интервала анализа построим гистограмму исследуемого фактора по выбранному перечню объектов наблюдения (например, по 100 крупнейшим предприятиям России). Сопоставим эти гистограммы. И, если окажется, что различие между гистограммами может быть признано несущественным (нет существенного смещения максимумов гистограмм друг относительно друга, гистограммы покрывают примерно один и тот же носитель), то целесообразно объединять данные по двум этим кварталам и строить сводную гистограмму. Контент объединенных данных в этом случае следует признать квазистатистикой для целей лингвистического анализа уровней фактора.
 
Аналогично квазистатистика выстраивается, когда имеет место схожесть гистограмм по двум отраслям экономики. Например (рис. 1), построение гистограмм фактора «цена-доход» по двум секторам экономики США (Basic Materials и Consumer Cyclical, июль 2003 года) позволяет говорить о схожести по двум критериям: совпадение максимумов гистограмм и покрытие примерно одного интервала носителя  (от 2.5 до 50).
 
 
 
 
 
Рис. 1. Сопоставление гистограмм по двум секторам экономики США.
 
А если взять данные по всей экономике США за 03 июля 2003 года (рис. 2), то видно, что эти данные обладают схожестью с данными рис. 1. И, следовательно, просматривается закономерность, позволяющая более-менее уверенно производить лингвистический анализ по этому фактору.
 
 
Рис. 2. Гистограмма P/E по всей экономике США (июль 2003 года)
 
Февральские данные по данному фактору (все сектора США) выглядят так (рис. 3):
 
 
Рис. 3. Гистограмма P/E по всей экономике США (февраль 2003 года)
 
Сопоставление рис. 3 и рис. 2 показывает, что различия здесь несущественны, и лингвистический анализ возможен на объединенном контенте этих данных.
 
Формально гистограмма – это математический объект следующего вида:
 
Г = {X, N, D, Z},                                                                                          (1)
 
где Х = [xmin, xmax] – интервал анализа носителя, N – число ячеек гистограммы (для рис. 1 – 3 N = 20), D = (xmax - xmin)/N – шаг гистограммы, Z – вектор числа попаданий квазистатистики в соответствующую ячейку гистограммы размерностью N.
 
            Гистограмма, приведенная к виду плотности – это гистограмма, в которой вектор Z заменен вектором
 
            fi = , i = 1..N.                                                                                    (2)
Именно по виду этих гистограмм идентифицируется вероятностный закон распределения (если он есть).
 
Нормированная гистограмма – такая, в которой вектор Z заменен вектором
 
            zi = , i = 1..N.                                                                               (3)
 
            Сопоставление нормированных гистограмм возможно, если для них совпадает носитель и число ячеек. Тогда можно выстроить меру схожести нормированных гистограмм, например, как меру Хэмминга. Тогда предельно схожие гистограммы имеют меру схожести 0, а предельно расходящиеся нормированные гистограммы – единицу (т.е. носитель критерия – стандартный 01-носитель).
 
Критерий схожести может получить лингвистическую интерпретацию в виде пенташкалы «ОН – Н – Ср – В – ОВ». Построить такую пенташкалу можно, если на систематической основе давать экспертному сообществу на сопоставление две нормированные гистограммы с предложением дать лингвистическую оценку схожести этих гистограмм. Но в данном исследовании мы не ставим перед собой задачу углубляться в этот предмет. Мы считаем, что на входе модели лингвистического анализа находится квазистатистика, и все предварительные работы экспертов по ее согласованию уже состоялись.
 
Итак, мы хотим сопоставить гистограмме вида, например, рис. 2, пенташкалу, каждому словесному элементу которой отвечает нечеткое число. Причем целесообразно, чтобы построенный классификатор был разновидностью так называемой «серой» шкалы Поспелова [4], представляющей собой полярную (оппозиционную) шкалу, в которой переход от свойства А+ к свойству А- (например, от свойства «большой дом» к свойству «дом среднего размера» лингвистической переменной «Размер дома») происходит плавно, постепенно. Подобные шкалы удовлетворяют условиям [5]: а) взаимной компенсации между свойствами А+ и А- (чем в большей степени проявляется А+, тем в меньшей степени проявляется А-, и наоборот); б) наличия нейтральной точки А0, интерпретируемой как точка наибольшего противоречия, в которой оба свойства присутствуют в равной степени (например, когда дом кажется одновременно и большим, и средним по размерам).
 
В случае стандартной пенташкалы, определенной на 01-носителе, абсциссы нейтральных точек на 01-носителе имеют координаты (0.2, 0.4, 0.6, 0.8) [6], а сам такой пятиуровневый классификатор, построенный на трапециевидных нечетких числах, имеет вид рис. 4.

Рис. 4. Стандартная пенташкала на 01-носителе
 

И ясно, что пенташкала на трапециевидных числах является серой шкалой в смысле Поспелова, и лингвистический анализ на ее основе будет непротиворечивым.
 
Покажем, как строить пенташкалу в простейшем случае. Пусть имеется унимодальная гистограмма фактора, с «подозрением» на то, что за этой гистограммой стоит нормальное распределение. Тогда, по общим правилам статистики, определим среднее значение m гистограммы и среднеквадратическое отклонение от среднего (СКО)  s. Построим набор из пяти узловых точек пятиуровнего классификатора по правилу:
 
m1 = m - t1s,
m2 = m - t2s,
m3 = m ,
m4 = m + t2s,
m5 = m + t1s,                                                                                                  (4)
 
где ti – коэффициенты, в классической статистике являющиеся коэффициентами Стьюдента. Для каждой узловой точки классификатора справедливо, что в ней уровень фактора распознается, однозначно, со стопроцентной экспертной уверенностью. Например, точка m1 отвечает очень низкому уровню фактора (ОН), m2 – состоянию Н и т.д.
 
Далее поделим каждый отрезок [mi, mi+1] на три зоны: зону абсолютной уверенности, зону пониженной уверенности и зону абсолютной неуверенности. Длины этих трех зон составляют пропорцию 1:u:1, где параметр u³0 выражает глубину неуверенности. Так, при u=0 пониженной уверенности нет, и разграничение зон является жестким (интервальным). В противоположном случае, при u=¥, абсолютной уверенности-неуверенности нет (как, например, для случая контроллера температуры Мамдани [7], рис. 5). Для случая стандартной пенташкалы на 01-носителе u=2. Так что выбор u – это дело разработчиков классификатора.
 
Нанесем дополнительные точки (границы зон уверенности-неуверенности) на ось носителя фактора. Тогда можно в зоне уверенности принять соответствующую функцию принадлежности за 1, в зоне абсолютной неуверенности – за 0, а зону неуверенности описать наклонным ребром соответствующего трапециевидного нечеткого числа. Таким образом, первое приближение пенташкалы построено.
 
 
Рис. 5. Лингвистическая переменная «Уровень комнатной температуры» [7]
 
Пример. По гистограмме вида рис. 5 для носителя Х=[0, 10] определяем: m = 4.5, СКО = 2. Также задаемся u=1, т.е. все зоны уверенности - пониженной уверенности - неуверенности имеют равную длину.
Рис.6. Гистограмма нормально распределенной статистики.
 
Значение 0.5 носителя гистограммы представляется экспертам очень низким, а значение 8.5 – очень высоким. Отсюда и из (4) сразу следует t1 = (4.5 – 0.5)/2 =                (8.5 – 4.5)/2 = 2. Значение 2 носителя представляется экспертам низким, поэтому t2 = (4.5 – 2)/2 = 1.25. Соответственно, непротиворечивая классификация дает m4 = m + t2s = 4.5+1.25*2 = 7.
 
Таким образом, интервалы зон абсолютной уверенности следующие:
 
ОН:     [0, 0.5+(2-0.5)/3] = [0, 1];
Н:        [2-(2-0.5)/3, 2+(4.5-2)/3] = [1.5, 2.83];
Ср:      [4.5-(4.5-2)/3, 4.5+(7-4.5)/3] = [3.67, 5.33];
В:        [7-(7-4.5)/3, 7+(8.5-7)/3] = [6.17, 7.5];
ОВ:     [8.5-(8.5-7)/3, 10] = [8,10];                                                              (5)
 
Соответствующая выделенным узловым точкам и интервалам абсолютной уверенности пенташкала представлена на рис. 7.
 
Рис. 7. Пенташкала для гистограммы рис. 5
 
В дальнейшем эксперт может, уточняя полученный классификатор на основании дополнительных соображений, управлять местоположением узловых точек классификатора и получать новые функции принадлежности.
 
В более сложном случае, когда симметрии нет, необходимо ассоциировать узловые точки пенташкалы с гистограммой на основе экспертного опроса. Все остальное (определение интервалов абсолютной уверенности/неуверенности) производится по вышеизложенной схеме. Продемонстрируем это на реальном примере гистограммы рис. 2.
 
Пусть эксперты единодушно договорились о том, чтобы считать:
 
m1 = 5 – очень низкое значение фактора P/E;
m3 = 15 - среднее значение фактора P/E;
m5 = 30 - очень высокое значение фактора P/E;
u =1.                                                                                                             (6)
 
Но эксперты затрудняются с получением узловых точек m2 и m4. Можно было бы примитивно задать m2 = (m1+m3)/2 = 10, m4 = (m3+m5)/2 = 22.5, но такое задание пренебрегает формой гистограммы, а ее хотелось бы учесть в анализе. Такой учет возможен, если искать узловые точки по правилам взвешенного среднего. Тогда:
 
m2 = ;                                  (7.1)
 
 
m4 = ;                                                                                                                                                  (7.2)
 
Значения вектора уровней гистограммы представлены в табл. 1:
 
Табл. 1. Вектор уровней гистограммы Z

Всего найдено страниц: 3
Страницы: 1  2  3 

К списку материалов

Семинары по Финансам

» ФИНАНСОВЫЙ ДИРЕКТОР 2012
» Управление финансами для руководителя
» Денежный менеджмент: как организовать движение потоков денег
» Финансы для нефинансистов: ключевые навыки
» Финансовый менеджер
» СОВРЕМЕННЫЕ ФИНАНСОВЫЕ ИНСТРУМЕНТЫ: индивидуальный выбор профессионала
» КУРС ПОВЫШЕНИЯ КВАЛИФИКАЦИИ ДЛЯ ФИНАНСИСТОВ 180 ЧАСОВ
» Управление затратами: методы распределения и расчета
» Организация и оптимизация финансово-экономических служб
» ДИРЕКТОР ПО ЭКОНОМИЧЕСКОМУ РАЗВИТИЮ 2012
» ГЛАВНЫЙ ЭКОНОМИСТ 2012
» Экономическая политика компании: планирование и анализ
» Финансовый анализ: от классики до модерна
» ФИНАНСОВЫЙ АНАЛИТИК 2012
» Классический финансовый анализ
» Количественный анализ данных финансовой отчетности
» Анализ эффективности: выбор показателей и оценка эффекта финансового и операционного левериджа
» Финансовый анализ: профессиональный подход
» Реструктуризация компании как инструмент роста акционерной стоимости
» Отчетность предприятия по МСФО. Практика составления финансовой и управленческой отчетности
» От хаотичных действий к регулярному бюджетированию
» Система казначейства: организация, автоматизация и функции
» Практика бюджетирования на основе сбалансированной системы показателей (BSC)
» Управленческий учет: практика применения
» Контроллинг: актуальные аспекты
» Внутренний аудит: система корпоративного контроля
» Дебиторская задолженность как элемент финансовой отчетности организации

Видеокурсы по Финансам

» Управление финансами
» Финансовый менеджмент в системе корпоративного управления. Финансирование деятельности компании.
» Финансы для нефинансиста
» Управление личными финансами: ключевые направления частного инвестирования
» Управление дебиторской задолженностью

Ближайшие семинары Русской Школы Управления:

Москва

Санкт-Петербург