Я всегда считал генеральную уборку слишком маленькой и слишком поздней. Для меня январь - это когда вы заказываете, расставляете приоритеты и начинаете отвечать на вопросы наступающего года. Вот почему я выбрал январь, чтобы ответить на вопрос, который у вас, возможно, был давно: что такое машинное обучение?
Я отвечу на этот вопрос, а также определю некоторые другие термины, которые вам нужно знать, чтобы оставаться на вершине 2017 года. Если вам интересно, что программное обеспечение для бизнес-аналитики может сделать для вас, вам сначала нужно знать эти основные термины. .
Я поставил машинное обучение на первое место, поскольку это одна из десяти главных стратегических технологических тенденций Gartner на 2017 год , но остальные записи расположены в алфавитном порядке.
До появления машинного обучения компьютерам нужно было указывать (программировать), как думать. С машинным обучением компьютеры могут думать (как бы) сами за себя.
Недавно я разговаривал с Майклом Финли, главой отдела машинного обучения компании AnswerRocket , занимающейся разработкой программного обеспечения для бизнес-аналитики , и он помог мне в разработке. До машинного обучения большая часть программного обеспечения «работала так, как было запрограммировано: люди превращали инструкции в компьютерный код, а компьютер делал то, что этот код велел ему делать». Очень простым примером может быть калькулятор: вы вводите числа калькулятора, говорите ему, что делать (складывать, вычитать), и калькулятор дает вам результаты. Однако с машинным обучением программное обеспечение может адаптироваться. Финли продолжает: «Программное обеспечение с машинным обучением не делает того же самого в день, когда вы его устанавливаете, как на десятый или сотый день запуска». Если значения, вводимые в компьютер, изменятся, программное обеспечение адаптируется к этим значениям. Компьютер с машинным обучением учится включать их.
Предоставлено потрясающими комиксами Андре Пинто и Муравейник
Финли характеризует машинное обучение как программное обеспечение, которое знает, как справиться с концепцией «нравится», например: «Я хочу услышать песню, подобную последней, которую я только что услышал». Идея проста для людей, но непроста для компьютеров. Финли объяснил, что компьютеры хорошо понимают, какие числа больше или меньше, и сопоставляют числа и имена, но они борются с идеей сходства. Машинное обучение помогает компьютерам понять, почему одно «похоже» на другое. Понимание сходства машинным обучением особенно полезно для прогнозирования желаний клиентов.
Машинное обучение стоит за следующей песней, которую вы услышите на Pandora, или фильмом, который предлагает Netflix. Алгоритмы машинного обучения Pandora и Netflix «кормят» ваш выбор (и фактические «лайки» в случае Pandora) и используют это, чтобы предсказать, какие похожие песни или шоу вам могут понравиться.
Подайте в эти алгоритмы машинного обучения разные данные, и они будут реагировать по-разному. Если ваша обычная диета из фильмов ужасов внезапно и необъяснимо включает романтическую комедию, алгоритмы машинного обучения Netflix отреагируют на эти данные и начнут предлагать другие романтические комедии или романы ужасов.
Если отбросить вкус к кино, почему машинное обучение так важно для малого и среднего бизнеса? Это может помочь им конкурировать с более крупными конкурентами. Программное обеспечение бизнес-аналитики с машинным обучением принимает новые цифры при каждом обновлении. Вы не основываете стратегию на цифрах годового отчета, вы основываете ее практически на информации, поступающей в режиме реального времени, и на алгоритмах, которые знают, как адаптироваться к изменяющимся данным. Финли объясняет, что традиционный, однородный способ масштабирования бизнеса, что бы он ни делал, может быть революционизирован с помощью машинного обучения:
«Я мог бы изложить передовой опыт и захотел бы повторить процессы. Но что, если бы вы могли излагать лучшие практики каждый день, если бы у вас была информация, чтобы менять их и переформулировать свою стратегию каждый день? Благодаря машинному обучению у вас есть данные, которые могут переписывать стратегию каждый день, и именно поэтому малые и средние предприятия действительно едят обед с большими парнями ».
Для малого и среднего бизнеса, заинтересованного в гибкой бизнес-стратегии, машинное обучение может быть больше, чем просто способ выжить. Это может быть способом начать забирать часть рыночных долей устоявшихся игроков.
Специальная аналитика - это анализ, когда он вам нужен, на уровне, понятном даже не ИТ-специалистам.
Если доступная бизнес-аналитика кажется очевидным желанием, это не всегда достижимо. Долгое время профессионалы бизнес-аналитики должны были уметь «говорить на компьютере» (т. Е. Писать на языке программирования), чтобы запрашивать программы бизнес-аналитики. Не знали, как писать код на SQL, R или Python? Спросите кого-нибудь из ИТ, кто знает. Тогда подожди. А затем подождите, пока сработают программы бизнес-аналитики, а затем подождите еще немного анализа.
К счастью, бизнес-аналитика наконец-то созрела до специальной аналитики. : С этой системой вам не нужно ждать, пока ИТ-специалисты или медленные темпы создания традиционных отчетов предоставят вам необходимые данные. Это делает вашу работу и их работу проще и менее напряженной.
Если у вас нет ИТ-персонала, специальная аналитика решит эту проблему. Специальная аналитика также сокращает время получения информации (это еще одно модное слово, которое вы можете встретить; это означает, что для получения необходимой информации требуется меньше времени).
«Запросы» - это вопросы, на которые вы можете попросить свое программное обеспечение бизнес-аналитики. Например, вы можете попросить свое программное обеспечение бизнес-аналитики составить алфавитный список всех кареглазых клиентов, родившихся с 1970 года. Вы могли бы так же легко назвать запрос вопросом, но как часто вы можете говорить «запрос» в разговоре?
Специальный запрос - это тот, который вы можете запросить, когда вам это нужно. Как и в случае с более ранней бизнес-аналитикой, для более старых запросов требовалось, чтобы кто-то из ИТ-специалистов мог их задать. Запросы также, как правило, выполнялись как часть регулярных отчетов, которые вы получали ежемесячно или ежегодно. В более старом программном обеспечении бизнес-аналитики вам пришлось бы задавать этот запрос на языке программирования. SQL был давним стандартом бизнес-аналитики; в наши дни популярны R и Python.
Вы можете рассматривать компьютерные программы, включая BI, как ветви бюрократии, от Министерства юстиции до HHS. Технически они существуют для выполнения задач, но у каждого из них есть свой язык и они работают по-своему. Программист подобен бюрократу, который говорит на этом языке и знает, как ориентироваться в каждой программе / отделе.
Этот термин фактически выходит за рамки бизнес-аналитики. «Бизнес-аналитика» традиционно занимается анализом того, что происходит. Расширенная аналитика идет дальше, будь то прогнозирование того, что произойдет в будущем, или анализ деталей и факторов, обычно не связанных с бизнес-аналитикой. Некоторыми примерами расширенной аналитики являются интеллектуальный анализ данных и текста , предиктивная аналитика , прогнозирование , анализ местоположения , анализ настроений и машинное обучение.
Машинное обучение - это одна из частей ИИ, но ИИ представляет собой гораздо более широкую концепцию. ИИ включает в себя все, что можно назвать « интеллектом, проявляемым машинами ». «Интеллект» в смысле ИИ означает способность что-то делать. Итак, общепринятое понимание «интеллекта» как простого знания многого - это не тот интеллект, который можно найти в ИИ.
«Что-то», что может сделать ИИ, уже разнообразно. Например, Daisy Intelligence
использует ИИ для изучения данных розничных продавцов, а затем дает рекомендации, которые, по их утверждению, могут «увеличить продажи на 5% и более». Если, как и я, вам нравится составлять расписание так же, как ждать в DMV, виртуальный помощник, такой как Эми
, который может планировать встречи на основе предпочтений посетителей, может стать вашим лучшим новым воображаемым другом.
Большие данные - это чрезвычайно большие наборы данных. Хотя я обычно согласен со Стивеном Кингом в том, что « дорога в ад вымощена наречиями », это «чрезвычайно» оправдано. Небольшой объем данных был бы, скажем, небольшой книгой. Размер PDF-файла первой книги о Гарри Поттере составляет около одного мегабайта (МБ).
Большие данные - это что-то вроде петабайта данных. Продолжая пример с книгой, все
, что написано с начала записанной истории, составляет 50 петабайт
. Мегакорпорации, такие как Google, занимаются петабайтами. Система Google Mesa
, которая отслеживает рекламный трафик Google, отслеживает петабайты данных.
Контекстные данные - это дополнительные данные о человеке, месте или событии (которые в языке данных называются «сущностями»). Контекстные данные помогают дополнить то, что бизнес знает о потенциальном клиенте, и даже предсказать, чего он может захотеть.
Хотя это не бизнес, Манчестерский университет в Англии использует контекстные данные в процессе приема, чтобы « создать полное и всестороннее представление о ваших достижениях и потенциале ». Наряду с формой зачисления учащегося UM учитывает такие факторы, как почтовый индекс кандидата, качество школы, в которой вы сдавали экзамены, и « находились ли вы под присмотром или под присмотром более трех месяцев».
Для бизнеса контекстные данные могут помочь продажам. В качестве очень широкого примера контекстные данные о прошлом покупателе, основанные на погоде в его местонахождении, могут увеличить доход. Покупатель из Тускона, штат Аризона, с большей вероятностью купит фруктовое мороженое в октябре, чем покупатель в Интернешнл-Фоллс, штат Миннесота
.
Точка данных - это отдельный фрагмент данных. Точка данных - это любая автономная единица или элемент данных среди отслеживаемых вами данных. Отдельной точкой данных может быть что угодно, от « размера инвестиций » до одного клика по объявлению, которое вы купили в Google. В случае с Uber местоположение является важной точкой данных, настолько важной, что они фактически отслеживают ее после того, как ваша поездка будет завершена .
Если вы знакомы с ключевыми показателями эффективности
, вы знакомы с точками данных. KPI измеряют определенные типы точек данных, такие как доход или время, необходимое для завершения проекта.
Качество данных - это мера полезности ваших данных. Данные высокого качества чистые, организованные и доступные. Если данные библиотеки - это ее книги, то в библиотеке с высококачественными данными книги, которые хочет и в которых нуждается население, будут в хорошем состоянии, разложенные в нужных местах.
Есть шесть измерений качества данных:
Визуализация данных - это любое изображение, визуальное или графическое, которое отображает ваши данные. Круговые диаграммы и гистограммы будут наиболее распространенными видами. Однако существует гораздо более широкий спектр визуализаций. Критерии оценки Gartner для платформ бизнес-аналитики и аналитики на 2016 год (защита платного доступа; того стоит) оценивают более сложные типы диаграмм как «предпочтительные» элементы, которые следует искать в вашем решении бизнес-аналитики . Вот некоторые из наиболее качественных и предпочтительных типов диаграмм, на которые стоит обратить внимание:
Хранилище данных - это компьютерная система, в которой хранятся и систематизируются данные из различных баз данных и транзакционных систем. Вы часто будете встречать термин с «предприятием» на лицевой стороне, так как вам понадобится большой объем данных корпоративного размера, чтобы потребовалось хранилище данных.
База данных - это данные, организованные таким образом, чтобы вы могли легко получить то, что вам нужно. Вы когда-нибудь были на IMDB
? Конечно, есть. Это база данных: фильмы, актеры, режиссеры, продюсеры, все организовано для удобного поиска, например, когда вам нужно обмануть в игре с шестью степенями Кевина Бэкона
.
Этот рисунок находится перед этим объяснением, потому что легче показать, как выглядит приборная панель.
Для формального определения: информационная панель - это визуальное представление данных, которые вы отслеживаете. В вашей программе бизнес-аналитики обязательно должна быть панель инструментов. Вы бы не купили машину без приборной панели. То же самое и с программным обеспечением для бизнес-аналитики.
Когда вы покупаете программное обеспечение бизнес- аналитики , убедитесь, что информационные панели вашей программы соответствуют этим двум базовым критериям, рекомендованным Gartner (защита платного доступа; того стоит):
Детализация - это способность брать общую информацию, такую как годовые данные о продажах, и детализировать ее по месяцам, неделям или даже дням. «Детализация» означает, что вы можете сузиться от общего к частному, что часто определяет разницу между информацией и пониманием. Drill down - это что-то вроде версии бизнес-аналитики в том старом фильме о «десятичных силах».
ETL - или извлечение, преобразование, загрузка - происходит между сбором данных и помещением этих данных в хранилище данных.
Необходимость «извлечения» проистекает из того факта, что данные собираются в базах данных или программном обеспечении ERP,
прежде чем они попадут в хранилище данных. Необходимость преобразования возникает из-за того, что эти несколько источников данных часто имеют разные форматы и должны быть преобразованы в правильный формат для хранения и поиска в хранилище данных. Необходимость загрузки не требует пояснений; вам нужно поместить его в хранилище данных, прежде чем вы сможете искать и сравнивать один источник данных с другим.
Метаданные - это данные о данных. Если это звучит, мета-, это ... это мета - данные !
Но серьезно.
Метаданные - это информация о ваших данных. Есть три категории:
«Метрика» - это просто причудливое слово для обозначения того, что вы измеряете.
Вы отслеживаете свою чистую прибыль? Это показатель. Следите за тем, сколько людей используют программное обеспечение бизнес-аналитики в вашей компании? Это тоже показатель. Следите за темпом разговора? Это тоже показатель. Уловка с метриками заключается в том, чтобы выбрать те, которые лучше всего подходят для вашей компании. У каждой компании разные потребности, и при выборе показателей
рекомендуется учитывать свои потребности и приоритеты
.
Термин современная бизнес-аналитика пришла от Gartner , который определяет его так :
Современная платформа бизнес-аналитики поддерживает разработку аналитического контента с помощью ИТ. Он определяется автономной архитектурой, которая позволяет нетехническим пользователям автономно выполнять полный спектр аналитических рабочих процессов - от доступа к данным, их приема и подготовки до интерактивного анализа и совместного использования идей.
Проще говоря, современная бизнес-аналитика ставит на первое место бизнес-пользователя. Вам не нужно зависеть от кого-то из ИТ-отдела, или вам нужно будет зависеть от него гораздо меньше, чтобы использовать современную программу бизнес-аналитики. В то время как традиционные, старые программы бизнес-аналитики были настроены таким образом, чтобы позволить ИТ-специалистам создавать контент, например, современные программы бизнес-аналитики позволяют бизнес-пользователям создавать контент самостоятельно.
Традиционные программы бизнес-аналитики сильно зависят от ИТ-персонала. Обычно они требуют, чтобы пользователи знали SQL (язык программирования, см. Ниже), и для получения ответов требуется гораздо больше времени, поскольку вам придется вручную вводить несколько запросов на этом языке. Как таковые, они гораздо менее гибкие, и эксперты, подобные тем, что есть в Gartner, предлагают покупателям вместо этого искать те функции, которые есть в современных программах бизнес-аналитики
.
Программное обеспечение как услуга - это модель, при которой покупатели приобретают лицензии на использование программного обеспечения, а не покупают и устанавливают его. Большинство программного обеспечения SaaS создается через Интернет (т. Е. В облаке), что снижает первоначальные затраты на покупку и установку. Это также избавляет от необходимости контролировать серверы, на которых хранится программное обеспечение; компания SaaS отслеживает любые возможные перебои в работе.
Нарезка и нарезка больших наборов данных, чтобы либо посмотреть на данные с разных точек зрения, либо на определенные части более подробно. Возможности нарезки и кости - это то, что, например, позволяет вам проверять данные по неделям, затем по месяцам, а затем по отдельным дням. Вместо того, чтобы ждать отчета, программа slice and dice позволяет вам проявить инициативу и проверить конкретные данные, когда вам это нужно.
SQL - это распространенный язык программирования, используемый для получения информации из баз данных. Если вы говорите по-английски, база данных говорит на языке SQL, и она будет знать только, как отвечать на вопросы, сформулированные таким образом. Если, конечно, ваше программное обеспечение для бизнес-аналитики не имеет запросов на естественном языке (NLQ), которые позволяют вам задавать вопросы так же, как и в поисковой системе.
Или что, по вашему мнению, принесет пользу читателям этого списка? Сообщите мне их в комментариях ниже. В идеале, раздел комментариев мог бы стать еще одним местом, где люди могли бы запрашивать определения, а я мог бы их предоставить.
Если вы хотите узнать, как эти термины могут помочь вам лучше, ознакомьтесь с одним из вариантов в каталоге программного обеспечения для бизнес-аналитики Platforms и обратитесь к поставщику.
Ищете программное обеспечение для бизнес-аналитики? Ознакомьтесь со списком лучших программных решений для бизнес-аналитики Platforms .