Большие данные (Big Data)
Большие данные — данные большого объема, высокой скорости накопления или изменения и/или разновариантные информационные активы, которые требуют экономически эффективных, инновационных формы обработки данных, которые позволяют получить расширенное понимание информации, способствующее принятию решений и автоматизации процессов.
- Для каждой организации или компании существует предел объема данных (Volume) которые компания или организация способна обрабатывать одновременно для целей аналитики, как правило этот объем ограничен объемами оперативной памяти серверов корпоративных приложений и баз данных и необходимостью партиционирования (Partitioning) хранимых данных.
- Для каждой организации или компании существуют физические ограничения на количество транзакций/ объем данных (Velocity) , которая корпоративныя система может обработать или передать за единицу времени вследствии ограничений scale in архитектуры.
- Традиционные корпоративные системы (реляционные) могут использовать эффективно только структурированные источники поступления информации, не принимая во внимание разновариантные и не структурированые источники данных (Variety) или имея серьезные органичения по работе с такими источниками.
- Большое количество данных и разнообразие источников требует качества и аккуратности при обработке и анализе данных (Твиты, хэштэги, аббревиатуры, сокращения, типо ошибки и конечно просто надежность и точность контента ставят под сомнение достоверность (Veracity) самих данных так и принятых решений на основе этих данных. Количество не переходит в качество.
- Cбор и анализ больших данных должен предоставлять определенную ценность (Value) для бизнеса. Ценность данных неразрывна связанна со стоимость владения и ценностью для бизнеса
- Большие данные, зависимости между ними и условия окружения непрерывно меняются (Variability)