Класифікація економічних даних



Класифікація і кодування - це дві невіддільні частини одного процесу - перекладу різноманітної економічної інформації з природної мови на формалізовану мову ЕОМ. Наведемо основні терміни й поняття, використовувані в цій галузі.

Класифікація - поділ множини об'єктів на частини за їх подібністю або відмінністю згідно з прийнятими методами.

Під час класифікації використовуються такі поняття:

Система класифікації-сукупність методів і правил класифікації та їхній результат.

Об’єкт класифікації – елемент класифікованої множини.

Ознака класифікації – властивість або характеристика об’єкта, за якою виконується класифікація.

Значення ознаки – якісне або кількісне вираження ознаки класифікації.

Класифікаційне угруповання – частина об’єктів, яка виділена під час класифікації. Найпоширенішими є такі назви класифікаційних угрупувань: клас, підклас, група, підгрупа, вид, підвид, тип.

Ступінь класифікації – етап класифікації при ієрархічному методі, внаслідок якого формується сукупність класифікаційних угруповань (або результат чергового поділу об’єктів одного класифікаційного угруповання).

Глибина класифікації – кількість ступенів класифікації.

Засобом вираження результатів класифікації є кодування.

Кодування – створення і присвоєння коду класифікаційному угрупованню та об’єктові класифікації.

Код – знак, або сукупність знаків, узятих для позначення класифікаційного угруповання і об’єкта класифікації.

Алфавіт коду – система знаків, узятих для створення коду.

Основа коду – кількість знаків у алфавіті коду.

Розряд коду – позиція знака в коді.

Довжина коду – кількість знаків у коді без урахування пропусків.

Структура коду – умовне позначення складу та послідовності розміщення знаків у коді.

Контрольне число – розрахункове число, яке використовується для перевірки вірогідності запису коду.

Перекодування – присвоєння закодованому об’єктові нового коду.

Перекодувальні таблиці – таблиці взаємної відповідності кодів одних і тих самих класифікаційних угруповань, або об’єктів класифікації з різних класифікаторів.

Матеріальним утіленням класифікації і кодування є класифікатор.

Класифікатор – офіційний документ, що являє собою систематизований перелік назв і кодів класифікаційних угруповань або об’єктів класифікації.

Класифікатори можна створювати системним або локальним способом. За системного способу інформація класифікується з урахуванням вимог різних рівнів управління (підприємство, міністерство, відомство тощо), за локального – у межах одного підприємства, організації або установи.

Класифікація і кодування – невіддільний елемент створення і функціонування комп’ютерних ІС. Метою класифікації і кодування є упорядкування і взаємоузгодження різних предметів, понять, властивостей чи інших елементів інформації. Використанням кодів можна значно скоротити обсяги інформації та трудомісткість її обробки на всіх етапах технологічного процесу автоматизованої обробки даних.

 

Методи класифікації економічної інформації.

 

Метод класифікації це сукупність правил створення системи класифікаційних угруповань і їх зв’язки між собою.

Розрізняють два основні методи класифікації:

1 – ієрархічний;

2 – фасетний.

Ієрархічний метод класифікації характеризується тим, що початкова множина об’єктів техніко-економічної інформації послідовно поділяється на угруповання (класи) першого рівня поділу, далі – на угруповання наступного рівня тощо.

Сукупність угруповань утворює при цьому ієрархічну деревоподібну структуру, яку часто зображають у вигляді розгалуженого графа; вузлами цього графа є угруповання. Кожному об’єктові в даному випадку на кожному рівні відводиться місце лише в одному класифікаційному угрупованні, тобто такі угруповання не повторюються і кожне з них поділяється лише по одній і тій самій основі класифікації.

Недоліки ієрархічного методу класифікації:

· жорсткість структури, яка зумовлена фіксованістю ознак і їхньою послідовність;

· не дає змоги агрегувати об’єкти за будь-яким раніше не передбаченим довільним поєднанням ознак;

· ускладнює автоматизовану обробку, оскільки утворюється нестандартний розподіл послідовності ознак.

Перелічені недоліки ієрархічного методу класифікації компенсуються фасетним (багатоаспектним)методом, за якого початкову множину об’єктів можна незалежно поділяти на класифікаційні угруповання щоразу з використанням однієї з обраних ознак.

Кожна ознака фасетної класифікації відповідає фасеті, що являє собою список значень найменованої ознаки класифікації. Наприклад, ознака „колір” містить список значень: „червоний”, „білий”, ..., „зелений” тощо.

Отже, систему класифікації можна подати переліком незалежних фасетів (списків), які містять значення ознак класифікації.

Вибір того чи іншого методу класифікації залежить від мети досліджень економічних даних і повинен виконуватись з врахуванням задоволення вимог всього комплексу задач управління.

 


Дата добавления: 2019-02-13; просмотров: 252; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!