The words you are searching are inside this book. To get more targeted content, please make full-text search by clicking here.

Рассмотрены основные методы и алгоритмы анализа данных для веб-разработки и маркетинга, в том числе методы декомпозиции, визуализации, функционально-стоимостного анализа, эконометрический метод и другие. Приведены алгоритмы семантического анализа текстов, ранжирования смысловых приоритетов и отбора ключевых фраз, алгоритмы оценки потребительской лояльности, в том числе алгоритм оценки тональности текстов, алгоритм анализа качества веб-интерфейсов Mobile First и другие. Рассмотрены задачи прогнозирования коммерческого спроса, анализа потребительского доверия к бренду, сокращения рекламных расходов, а также комплексного анализа данных деятельности компании. Описан общедоступный инструментарий, такой как Яндекс.Подбор слов, Яндекс.Метрика, ExportBase, Яндекс.Поиск, ГлавРед, EditPlus, Антиплагиат, Гугл.Таблицы, MS Excel и Google Mobile Test.

Discover the best professional documents and content resources in AnyFlip Document Base.
Search
Published by BHV.RU Publishing House, 2024-02-14 13:44:01

Методы и алгоритмы анализа данных для веб-разработки и маркетинга

Рассмотрены основные методы и алгоритмы анализа данных для веб-разработки и маркетинга, в том числе методы декомпозиции, визуализации, функционально-стоимостного анализа, эконометрический метод и другие. Приведены алгоритмы семантического анализа текстов, ранжирования смысловых приоритетов и отбора ключевых фраз, алгоритмы оценки потребительской лояльности, в том числе алгоритм оценки тональности текстов, алгоритм анализа качества веб-интерфейсов Mobile First и другие. Рассмотрены задачи прогнозирования коммерческого спроса, анализа потребительского доверия к бренду, сокращения рекламных расходов, а также комплексного анализа данных деятельности компании. Описан общедоступный инструментарий, такой как Яндекс.Подбор слов, Яндекс.Метрика, ExportBase, Яндекс.Поиск, ГлавРед, EditPlus, Антиплагиат, Гугл.Таблицы, MS Excel и Google Mobile Test.

Keywords: Яндекс.Метрика, ExportBase, Яндекс.Поиск, ГлавРед, EditPlus, Антиплагиат, Гугл.Таблицы

Факторный анализ для оптимального выбора 215 дение факторов и их элементов. Детализация факторов может быть продолжена и далее. Впоследствии, с развитием науки во II половине XX века, факторный анализ стал базовым логическим инструментарием, и сейчас он добавлен во все основные программные решения статистической обработки данных, в том числе в R, SAS, SPSS, Statistica, Stata[en]. Решение сложных задач с помощью факторного анализа Приведем для примера несколько опубликованных исследовательских задач, в основе решения которых лежит методика факторного анализа. Формулировки их названий характеризуют высокую социальную значимость описанных в них исследований. В области экономики: «Факторный анализ причин инфляционного процесса в российской экономике»1 . В работе представлена характеристика влияния изученных факторов (дефицита и профицита бюджета и др.) на инфляционный процесс в экономике России. В области медицины: «Алгоритмы статистического анализа в медицине»2 . В работе производится сопоставление эффективности лечения препаратами независимых групп больных и описание влияния выявленных факторов на эффект выздоровления. В менеджменте: «Факторный анализ операционной деятельности как инструмент мониторинга выполнения поставленных целей»3 . В работе выполнено определение основных факторов влияния на эффективность и результативность финансовой деятельности предприятия. Эти научно-исследовательские работы представлены в качестве домашнего задания для самостоятельного изучения, чтобы у читателей была возможность оценить круг задач, выполняемых по методике факторного анализа. Объектно-ориентированный подход к многофакторному анализу Веб-разработка цифровых продуктов — попросту говоря, работа с исходным кодом, — требует от специалистов объектно-ориентированного подхода. Принятие решения о выборе из условных двух сопоставимых вариантов A и B на доказательном уровне невозможно без проведения их многофакторного анализа. 1 Орусов Д. В. Научная статья // Финансы и кредит. 2000. № 3 (63). С. 7, 15. (https://tinyurl.com/79efep9d). 2 Поветкин С. В., Филиппенко Н. Г. Методические рекомендации для студентов. (https://tinyurl.com/48p33d4f). 3 Авторы: Кашуба В. О. и Цой А. В. (https://moluch.ru/archive/132/36959/).


216 Глава 8 В частном случае если признаки сравнения моделей A и B являются не количественными, а качественными, то вводится проверка их на логическое соответствие заданному признаку (или группе признаков). При этом возможно интерпретировать наличие или отсутствие заданного признака как логическую переменную (0 или 1). Если наличие признака зафиксировано, то это отмечается как истина, этому критерию в таблице сравнения назначается оценка в 1 балл и т. д. Сравнение условных объектов A и B выполняется по сумме баллов (соответствия требованиям) каждого и выбирается искомый вариант с максимальным суммарным количеством баллов соответствия. Этот способ является частным случаем матрицы принятия решений, где в табличном виде по строкам размещены варианты для оптимального выбора, а по колонкам — факторы отбора. Пример № 1: матрица принятия решения Задача Выбрать подрядчика на разработку корпоративного сайта среди трех представленных агентств для выбора. Требования стоимость (до 100 тыс. руб.); опыт выполнения подобных работ; коммуникация (комфорт в диалоге); отзывы клиентов. К рассмотрению Агентство № 1, агентство № 2 и агентство № 3. Решение 1. Расставим оценки качества трех представленных подрядчиков (табл. 8.1). 2. Добавим весовые коэффициенты значимости факторов от максимума к минимуму в первой строке, начиная со второй колонки таблицы (табл. 8.2). Введение весовых коэффициентов ранжирования факторов способствует отбору от максимума к минимуму для повышения точности результата. В соответствующих ячейках для каждого агентства выполним умножение оценки на весовой коэффициент для решения поставленной задачи с целью оптимального выбора варианта по заданным факторам. 3. Вычисление итоговой оценки с учетом весовых коэффициентов по сумме баллов представлено в табл. 8.3. Вариант с максимальным набором оценок по 5-балльной шкале в решении задачи является оптимальным.


Факторный анализ для оптимального выбора 217 Таким образом, агентство № 1 выиграло при выборе оптимального подрядчика услуг — несмотря на то, что стоимость работ подрядчиков № 2 и 3 ниже, чем у него, однако сумма факторов опыта, коммуникативных способностей и отзывов клиентов с учетом весовых коэффициентов у него выше. Таблица 8.1. Отбор оптимального варианта по заданным факторам Стоимость Опыт работы Коммуникация Отзывы клиентов Оценка Агентство № 1 5 2 3 3 Агентство № 2 3 4 2 5 Агентство № 3 1 5 3 4 Таблица.8.2. Отбор оптимального варианта по заданным факторам с учетом весовых коэффициентов Стоимость (вес: 5) Опыт работы (вес: 4) Коммуникация (вес: 3) Отзывы клиентов (вес: 2) Оценка Агентство № 1 5 × 5 = 25 2 × 4 = 8 3 × 3 = 9 3 × 2 = 6 Агентство № 2 3 × 5 = 15 4 × 4 = 16 2 × 3 = 6 5 × 2 = 10 Агентство № 3 1 × 5 = 5 5 × 4 = 20 3 × 3 = 9 4 × 2 = 8 Таблица 8.3. Отбор оптимального варианта по заданным факторам на основе итоговой оценки Стоимость (вес: 5) Опыт работы (вес: 4) Коммуникация (вес: 3) Отзывы клиентов (вес: 2) Оценка Агентство № 1 5 ×5 = 25 2 × 4 = 8 3 × 3 = 9 3 × 2 = 6 48 Агентство № 2 3 × 5 = 15 4 × 4 = 16 2 × 3 = 6 5 × 2 = 10 47 Агентство № 3 1 × 5 = 5 5 × 4 = 20 3 × 3 = 9 4 × 2 = 8 42 Вывод о матрице принятия решений По результатам рассмотрения приведенного примера сформулируем тезисно основные выводы о применимости матрицы принятия решений в работе аналитика: это доступный способ без лишних сложностей для принятия обоснованных решений; этот алгоритм решения полезен не только при выборе подрядчика — подходит и для других аналитических управленческих решений по выбору из ряда сопоставимых аналогов; матрица принятия решений актуальна для выполнения задачи факторного анализа с качественными критериями отбора.


218 Глава 8 Пример № 2: сравнительный многофакторный анализ Рассмотрим теперь задачу многофакторного анализа исходных данных. Задача Требуется провести сравнение интересных вариантов домов и выбрать оптимальный загородный дом по заданному бюджету для покупки с целью постоянного жительства. Условия регион задан; максимум три интересных варианта для сравнения; сроки для выбора дома ограничены — нужно отобрать варианты и сопоставить их для сокращения времени на осмотр перед покупкой. ПРИМЕЧАНИЕ Это возможно сделать даже без компьютера под рукой — в контексте задачи нам поможет факторный анализ. Решение Давайте последовательно решим задачу разложением ее на сущности. Объектом анализа является «загородный дом с участком». Эта сущность описывается целым рядом признаков, которые мы последовательно запишем и сгруппируем для логически обоснованного анализа. Сводная характеристика признаков описания загородного дома с участком представлена в табл. 8.4. Обратите внимание: важно разместить факторы ранжирования от максимального (в начале таблицы) и далее по убыванию к минимальному значению (в конце таблицы). В реальности допустимо добавлять к таблице и другие признаки описания, также учитывая ранги их значимости (это лишь уточнит итоговое значение результата для аналитика). Итак: факторы, определяющие признаки транспортной доступности, комфорта и безопасности, расставлены по приоритетам; при этом каждый аналитик имеет возможность ранжировать факторы по собственному усмотрению с точки зрения приоритетов важности в случае, если это не противоречит условиям задачи. ПРИМЕЧАНИЕ Опции комфорта (в недвижимости) — это признаки качества объектов недвижимости, определяющие в совокупности уровень комфорта для проживания в этом объекте. Рассмотрим также вопрос бюджета на покупку загородного дома. Тут есть три возможных варианта:


ГЛАВА 9 Задача сокращения рекламных расходов Практически каждый маркетолог в процессе своей деятельности имеет дело с задачей минимизации рекламных расходов — особенно в периоды сложной экономической ситуации, когда для эффективной работы компании нужно считать каждый рубль. В этой главе мы рассмотрим алгоритм ее решения с проверкой гипотез в A/B-тестировании, а также воспользуемся способом визуального сопоставления экспериментальных данных на графике их вывода. Постановка задачи в общем виде Пошаговое решение задачи сокращения (минимизации) рекламных расходов представлено на примере агентства недвижимости с использованием актуальных исходных данных. Для начала формализуем постановку задачи. Задача: Минимизировать (снизить до минимума) рекламные расходы агентства недвижимости на проведение i-й заявки. Исходные данные: • В среднем из 10 заявок результативно совершаются 1–2 сделки. • Средний комиссионный чек1 за сделку по продаже комнаты в коммунальной квартире составляет 100 тыс. рублей. Пояснения: Решение задачи сводится к поиску оптимального рекламного канала по заданным условиям и отсечению неэффективных каналов в следующем месяце. Необходимо достичь выполнения следующих условий: • найденный рекламный канал должен иметь минимальную стоимость привлечения i-й заявки; 1 Сокращенно «средний чек» — общеупотребимый термин для усреднения комиссии со сделки.


Задача сокращения рекламных расходов 243 • конверсия по этому каналу должна быть оптимальная — не менее 10 заявок в месяц с трендом к росту их количества в следующие периоды. • Выполнение задачи необходимо разделить между специалистами агентства, чтобы на одного специалиста приходился только один рекламный канал — тогда это будет согласовано и логично: каждый защищает собственное решение; • при прочих равных условиях: содержание рекламных предложений и таргетинг аудитории для унифицированного алгоритма отбора должны быть одинаковыми; входящая заявка (в маркетинге — «лид») должна стоить в среднем не более 500 рублей; рекламный бюджет в ходе эксперимента на каждый рекламный канал должен быть одинаковый и соразмерный среднему бюджету для размещения рекламы на месяц. Срок проведения анализа по задаче — необходимо и достаточно провести его в течение трех календарных месяцев. ЛОГИЧНЫЙ ВОПРОС: ПОЧЕМУ ДЛЯ АНАЛИЗА ВЫБРАН НЕ ОДИН МЕСЯЦ? Статистически значимым (в анализе данных) считается результат, полученный на основании исходных данных минимум за три значимых периода. Недели не подойдут, т. к. это слишком короткие периоды, причем в течение недели могут случиться праздники с изменением поведенческих привычек, поэтому для проверки гипотез о пользователях с точки зрения времени и каналов потребления рекламы необходимы именно месяцы. Рекламные каналы для анализа конверсии и цены Выбранные к сопоставлению основные рекламные каналы для анализа конверсии и цены на привлечение клиента представлены в табл. 9.1. Таблица 9.1. Источники рекламных каналов для аналитического исследования Рекламные каналы Источники Веб-сайт агентства недвижимости (SEO-статьи) https://[domain].ru2 Группа ВКонтакте https://vk.com/[domain] Рекламные рассылки с таргетингом на сайт и лендинги3 • SMS + email по расписанию; • 2 раза в месяц по базе клиентов Яндекс.Директ с таргетингом на сайт и лендинги по расписанию 2 Фрагмент записи [domain.ru] используется здесь и далее для замены настоящего домена. 3 Лендинг (от англ. landing page) — целевая страница для рекламы продукции в Интернете. Чаще всего используется для контекстной рекламы с целью проверки факторов влияния на покупательскую конверсию в A/B-тестировании.


244 Глава 9 Потребительские привычки пользователей отличаются в зависимости от их возраста, опыта использования веб-ресурсов и совершения покупок через Интернет. Поэтому необходимо на минимальном рекламном бюджете проверять, через какие каналы, в какие дни и в какое время лучше транслировать рекламу (в нашем случае — услуг агентства недвижимости). Результат для рассмотрения должен быть сохранен в табличном виде на основе доступной статистики из каждого рекламного канала. Для чистоты эксперимента сводить таблицу результатов должен независимый маркетолог — чтобы каждый из задействованных рекламных специалистов не пытался накрутить результаты по конверсии в собственных целях. Результаты Сводный табличный шаблон для отчета и анализа по рекламным каналам, принятым к рассмотрению в решении нашей задачи, представлен в табл. 9.2. Внесем по этому шаблону некоторые пояснения: XXX/YY/ZZ — это соответственно «Кол-во просмотров», «Цена привлечения i-й заявки», «Кол-во заявок (в месяц)»; табличный редактор Google.Sheets, доступный в режиме онлайн, выбран не случайно — он удобен для получения результатов от задействованных специалистов и сведения данных эксперимента в единую таблицу для последующего анализа; отбор в результате решения задачи выполняется с учетом выполнения всех упомянутых ранее условий и по достижении минимальной стоимости привлечения i-й заявки и тренда к росту их количества в месяц. На четвертый месяц можно исключить неэффективные рекламные каналы и перераспределить бюджет по одному или двум эффективным каналам. Этот алгоритм решения задачи сходен с A/B-тестом сравнения сходных товаров и услуг по спросу на выборке фокус-группы. И хотя в нашем примере рассматриваются рекламные каналы, условия иные и цель решения отличается по существу, но общая логика похожа — найти оптимальный вариант среди ряда возможных альтернатив. Таблица 9.2. Шаблон сводки по рекламным каналам в Google.Sheets Рекламные каналы Август Сентябрь Октябрь Веб-сайт агентства недвижимости (SEO-статьи) XXX/YY/ZZ ... ... Группа ВКонтакте XXX/YY/ZZ ... ... Рекламные рассылки с таргетингом на сайт и лендинги XXX/YY/ZZ ... ... Яндекс.Директ с таргетингом на основной сайт и лендинги XXX/YY/ZZ ... ... Более предметно мы рассмотрим это решение в частном виде на основе A/B-теста гипотез об эффективности использования выбранных рекламных каналов продвижения потребительских товаров и услуг.


Задача сокращения рекламных расходов 245 A/B-тестирование гипотез об эффективности рекламных каналов Принципиально решение задачи минимизации рекламных расходов путем A/B-тестирования соответствующих альтернативных гипотез помогает аналитику сформулировать ответы на ряд следующих коммерчески значимых вопросов маркетинга при продвижении товаров и услуг в экономически сложной ситуации, когда рекламный бюджет ограничен финансово (по внешним обстоятельствам): какие рекламные каналы дают конверсию в заявки из ряда представленных; сколько в среднем стоит входящая заявка из конкретного канала (в этот период); какие каналы неэффективны (бесполезны) для рекламы наших товаров и услуг; в какие дни и в какое время лучше рекламировать наши товары и сопутствующие услуги через основные дистанционные интернет-каналы рекламы; в каком рекламном канале на условную тысячу рублей мы получим максимум заявок для продаж (по прогнозу на следующий месяц)? Задача сокращения рекламных расходов в частном виде Здесь мы рассмотрим классическую задачу оптимизации рекламных расходов путем отработки и анализа используемых рекламных каналов с использованием инструментария A/B-теста. Представленный алгоритм решения задачи в пошаговом изложении поможет вебаналитикам в ходе практической работы с повседневными задачами маркетинга. Задачи: выявить устойчивые каналы рекламы для конверсии в регистрации пользователей веб-сервиса; сократить рекламные расходы. Исходные данные: средний бюджет на рекламные каналы (для старта эксперимента) составляет 50 тыс. рублей в месяц. Для анализа выбираем всего пять рекламных каналов (табл. 9.3). ПОЧЕМУ ТОЛЬКО ПЯТЬ КАНАЛОВ? Это разумно с точки зрения принципа «необходимо и достаточно» для отбора в условиях жесткой экономии рекламного бюджета. По умолчанию мы разделим исходный рекламный бюджет для апробации каналов на равные части: 50 000 руб. на 5 каналов = = 10 000 руб. каждому. Каждому рекламному каналу назначается UTM-метка для идентификации размещения рекламного объявления в собранной статистике (в аналитической системе Яндекс.Метрика).


246 Глава 9 Таблица 9.3. Сводка рекламных каналов для анализа Рекламные каналы Сокращения Средняя цена за клик в рекламном сообщении (CPC), руб. VKontakte VK {указать сумму} Facebook FB {указать сумму} YouTube YT {указать сумму} Google Ads GA {указать сумму} SMS Мегафон.Таргет MT {указать сумму} Конструкция UTM-метки композиционно отражена на рис. 9.1: в UTM-метке к веб-адресу целевого сайта добавляется конструкция из двух частей: параметр и значение метки (маркер для отбора результатов апробации гипотезы); параметр — это первое слово в UTM-метке (в примере на рис. 9.1 это utm_source). После параметра ставится знак «равно» и далее записывается его значение, которое задается по назначению для словестной идентификации англоязычной записью. Рис. 9.1. Схема реализации UTM-метки «yandex» в cсылке с URL-адресом домена Все участники эксперимента используют одинаковые параметры. В одной ссылке может быть несколько UTM-меток, и мы далее рассмотрим их примеры. Рекомендуется указывать минимум три параметра: источник трафика — utm_source (Google, Yandex, ВКонтакте, Facebook); тип трафика — utm_medium (email рассылки, оплата за клик, оплата за показы); название рекламной кампании — utm_campaign. Эти параметры называют обязательными, потому что без них ссылка не даст достаточно информации для аналитики. Если вы будете пользоваться генератором UTM-меток, вам нужно будет только вписать значения в пустые поля — генератор автоматически соберет ссылку (об этом рассказано далее). Параметры формируются одинаково, а значения — по личному решению ИТ-специалиста. При прочих равных условиях Правило «при прочих равных условиях» фактически означает, что все условия, кроме основных, должны быть одинаковыми:


Задача сокращения рекламных расходов 247 портреты аудитории; время показа — минимум три рабочие недели без ограничения времени (желательно без национальных праздников по календарю); геотаргетинг — например, Санкт-Петербург. Для формирования результатов проведенного теста для анализа данных: формируем таблицу (по шаблону, приведенному в табл. 9.4) и сохраняем в формате CSV4 ; храним на сервере в папке ../marketing/results.csv (в закрытом от индексации виде). ПРИМЕЧАНИЕ Если читатель внимательно посмотрит на значения в табл. 9.4, то обнаружит отсутствие запятых и точек с запятыми — это важно для того, чтобы значения в строках не сбились после экспорта в CSV с дальнейшим импортом в табличный редактор. Колонки в табл. 9.4 обозначены по-английски, вот пояснение их смысла на русском языке: Channels — рекламные каналы для сопоставления; Channel Brief Title — короткие наименования каналов (как маркеры-идентификаторы в UTM-метках); UTM — адресные ссылки с метками рекламных каналов; Advertising Period — периоды дат, когда выполнено рекламное размещение для теста. Таблица 9.4. Шаблон результатов проведенного теста Channels Channel Brief Title UTM Advertising Period VKontakte VK https://{domain}.ru/utm={VK-значение} 04.01.2021-10.01.2021 Facebook FB https://{domain}.ru/utm={FB-значение} 04.01.2021-10.01.2021 YouTube YT https://{domain}.ru/utm={YT-значение} 04.01.2021-10.01.2021 Google Ads GA https://{domain}.ru/utm={GA-значение} 04.01.2021-10.01.2021 Мегафон.Таргет MT https://{domain}.ru/utm={MT-значение} 04.01.2021-10.01.2021 Смысл пробного размещения в пяти рекламных каналах заключается в том, чтобы получить первичные данные по кликам, регистрациям (конверсиям), дням и времени (периоды, когда пользователи активно реагируют на данную рекламу). Единовременность размещения (колонка Advertising Period) должна быть соблюдена обязательно для сопоставления значений зарегистрированных событий (переходов по рекламным объявлениям) из разных альтернативных рекламных каналов. 4 Формат CSV (Comma-Separated Values, значения, разделенные запятой). На практике при экспорте табличных данных из MS Excel, Google.Sheets и других редакторов в CSV можно выбрать тип разделителей: запятые (comma) или точки с запятой (dot comma).


ГЛАВА 11 Семантический анализ данных пользователей веб-сервиса О точке приложения семантического анализа В главе 5 читателям уже были представлены метод и алгоритмы семантического анализа. Для эффективного применения этого инструментария нужна «точка приложения» с большими массивами данных. Как уже было сказано ранее, такие массивы формируются на основе данных из чатов и мессенджеров. При этом мобильные веб-сервисы выполняют роль связующего звена между целевой аудиторией и компанией-агрегатором дистанционных услуг. Основным платежным инструментом веб-сервисов являются микросервисы1 , характеризующиеся относительно низкой суммой платежей, доступностью практически всем потребителям и комиссией по модели service on demand. Поэтому они способны обеспечить значительный оборот платежей по потребительским услугам. Микроплатежи как финансовая транзакция характеризуются обычно двумя признаками: сумма i-го микроплатежа менее одного доллара; выполняются в режиме онлайн путем списания со счета клиента по факту подтверждения платежа. Наглядная иллюстрация микросервиса в интерфейсе веб-сервиса представлена на рис. 11.1. В этой главе мы рассмотрим практическую полезность внедрения аналитической функции в многопользовательский веб-сервис для решения задач монетизации микросервисов. Фактически речь пойдет об условиях рентабельности дистанционных услуг в веб-сервисе. По определению рентабельность — это ключевой экономический показатель эффективности ведения бизнеса. В контексте этой главы добавим уточнение — 1 Термин «микросервис» в контексте главы об анализе данных веб-сервиса трактуется как компонент системы массового обслуживания с функцией платежа по заданной услуге в привязке к определенному поставщику услуг.


272 Глава 11 интернет-бизнеса именно в формате веб-сервиса в интеграции с поставщиками услуг по модели service on demand. Рассматриваемые здесь задачи представлены в качестве примеров использования семантического анализа в веб-сервисах, содержащих мессенджеры, с целью рационального выбора дистанционных услуг для интеграции в веб-сервис с масштабной аудиторией. Рис. 11.1. Микросервис Подарить подарок в составе многопользовательского развлекательного веб-сервиса Подобные алгоритмы внедряются в популярных социальных сетях Facebook, ВКонтакте и мессенджерах для аналитического прогнозирования рентабельности микросервисов. При этом продвинутые алгоритмы контекстной рекламы на основе коммерческой оценки семантики пользовательского контента задействуются, чтобы автоматически формировать сбалансированные цены за клик по определенным ключевым словам и фразам с использованием весовых коэффициентов с заданной оценкой в денежном эквиваленте. Зачастую заявленные пользователями интересы при регистрации в веб-сервисе со временем трансформируются в зависимости от сезонных и иных трендов. Анализу подлежат коммерческий смысл и эмоциональный подтекст диалогов пользователей в поисках их реальных интересов, что позволяет оценить их покупательскую способность и желание потреблять услуги по запросу. С теоретической точки зрения в этой главе совмещаются семантический и когортный анализ поведения пользователей с точки зрения: влияния сезонных привычек пользователей на потребление ими тех или иных услуг по модели service on demand; того, когда и при каких условиях (основаниях) мужчины и женщины готовы покупать услуги в режиме онлайн. Определения когорты и когортного анализа уже были даны в этой книге ранее (см. разд. «Метрики повторных продаж и количества возвратов» главы 6) и будут


Семантический анализ данных пользователей веб-сервиса 273 уточнены далее — по мере изложения положений анализа. В целом эксперты рекомендуют проводить когортный анализ на выборке от 1000 пользователей для охвата и выработки статистически значимых результатов. Выделим тезисы для анализа в таком исследовании: частные выборки платежеспособных пользователей (когорты) обладают определенными интересами с разной степенью вовлеченности в активное использование; покупательская способность у пользователей обязательно должна быть выражена платежами для оценки рентабельности потенциальных услуг; конверсия в покупки у мужской и женской когорт пользователей предположительно различается по величине из-за различий в поведении и способам принятия решений. Постановка цели и задач семантического анализа Цель: отбор услуг по запросу для монетизации коммерческих интересов пользователей на основании оценки рентабельности по охвату целевой аудитории (ЦА). Перечислим задачи для анализа данных. 1. Формирование набора потенциальных микросервисов для внедрения в качестве гипотез для исследования с обоснованием и характеристикой выбранных услуг. 2. Внедрение инструментов для анализа: • словарь интересов 2 (Dictionary) пользователей; • средний чек (Average Bill / Month) для каждого пользователя. 3. Отбор и ранжирование потенциальных услуг из гипотез: • отбор услуг по среднему чеку и частоте упоминаний; • аналитическая функция R' для ранжирования услуг по степени значимости для коммерческой интеграции; • логическая схема семантического анализа для монетизации микросервисов. 4. Формирование результатов исследования: • построение отчета (в электронном виде и в формате PDF) с таблицами расчета метрик из нотации юнит-экономики, дохода, прибыли и порядка внедрения (services on demand), с ранжированием по уровню значимости для целевой аудитории от максимального к минимальному — конверсии по группам целевой аудитории, минимальному среднему чеку (Average Bill) для максимального охвата аудитории; 2 Словарь интересов используется в узконаправленном значении для анализа потребительских запросов в веб-сервисе с целью индикации перспективных услуг при сопоставлении с интересами целевой аудитории.


274 Глава 11 • визуализация результатов в виде раздела «Аналитика / Монетизация сервисов» в интерфейсе веб-сервиса. 5. Прогнозирование рентабельности микросервисов. Шаг № 1: формирование набора потенциальных микросервисов для внедрения в качестве гипотез Исследование следует начать с выбора услуг, имеющих коммерческий потенциал внедрения в виде микросервисов. Первоначальный список потенциальных услуг формируется путем мозгового штурма в диалоге с разработчиками веб-сервиса. Для обоснования первоначального выбора в таком диалоге достаточно аргументированных тезисов о потенциально пригодных услугах в соответствии с внешними признаками соответствия интересам пользователей. В табл. 11.1 собраны потребительские услуги, представляющие собой первоначальные гипотезы, пригодные для рациональной оценки состоятельности идеи об их интеграции с веб-сервисом путем семантического анализа. Приведем краткие характеристики выбранных потенциальных потребительских услуг: доступ к услугам в режиме онлайн; постоянный или периодический спрос по назначению; соответствующие ключевые фразы, формулирующие потребительский интерес аудитории к услугам по запросу3 , стоимость на услугу вычисляется эмпирически — минимальная сумма, которую готовы платить посетители за эту услугу (с оценкой ее рентабельности в дальнейшем анализе); условные аббревиатуры: • литера «М» — мужская аудитория; • литера «Ж» — женская аудитория. ПРИМЕЧАНИЯ Условная сегментация по гендерному признаку введена для анализа поведения мужской и женской аудитории, поскольку некоторые услуги имеют различную конверсию в зависимости от потребительских привычек мужчин и женщин. Эти данные потребуются впоследствии для функции R' в анализе. Понятно, что стоимость заказа такси указана минимальная (начальная) и зависит от ряда внешних факторов, но проверить ее также нужно по потенциалу к заказу в вебсервисе. 3 Представленный список ключевых фраз неполный и должен быть дополнен аналитиком реальными пользовательскими фразами самостоятельно.


ГЛАВА 12 Алгоритм анализа веб-интерфейсов Mobile First Программный алгоритм Mobile First, используемый для анализа качества исполнения веб-интерфейсов сайтов, загруженных в веб-сервис Mobile Friendly Test (корпорации Google Inc.), основан на факторном анализе по заданным признакам исходного кода и моделировании (рендеринге) страниц сайта. Принципиально этот алгоритм решает несколько функционально и социально значимых задач: оценивает удобство использования веб-сайтов с помощью мобильных устройств, что значительно повышает охват пользователей (вне офиса); способствует решению текущих задач на ходу; помогает в общей массе ранжировать сайты по их удобству и, как следствие, по признаку полезности для целевой аудитории. В 2020 г. Google Inc. объявила о планах внедрения алгоритма Mobile First (производного от алгоритма Mobile Friendly), который понижает в результатах поиска позиции сайтов, не адаптированных под мобильные устройства, даже если поиск ведется с устройств десктопных1 . В совокупности внедрение алгоритма Mobile First является социально значимым фильтром качества исполнения веб-сайтов, исполняемым по схеме, представленной на рис. 12.1: основными показателями качества веб-ресурса являются скорость загрузки (Largest Contentiful Paint, LPC), интерактивность (First Input Delay, FID), визуальная стабильность (Cumulative Layout Shift, CLS); эти показатели формируют поисковые сигналы для ранжирования и просмотра страницы согласно нотации Google Mobile First; специальный признак mobile friendly для веб-разработчиков и целевой аудитории маркирует удобство использования веб-ресурса. 1 См. https://search.google.com/test/mobile-friendly.


300 Глава 12 Рис. 12.1. Ключевые сигналы Google Mobile First для ранжирования веб-ресурсов С учетом динамики развития мобильного Интернета в России, которая показывает рост год от года, изучить принцип действия алгоритма Mobile First принципиально важно. По результатам исследования Cisco Annual Internet Report (сокр. AIR) на начало 2023 года доступ в Интернет будут иметь 78% населения РФ, число пользователей мобильных устройств составит 122,8 млн (84% населения), а доля 5G в стране достигнет 2,4% всех мобильных соединений. Поэтому проверка выпускаемого продукта на тесте Google Mobile Test просто необходима. Базовые рекомендации по веб-разработке, приведенные в этой главе, помогут добиться максимальной оценки качества и удобства использования веб-сервисов с мобильных устройств по критерию mobile friendly. Оценка целевой веб-страницы выполняется в этом тесте в соответствии с моделью, включающей сигналы Google Mobile First (см. рис. 12.1), по 100-балльной шкале. Возможность тестировать и вести отладку по полученному отчету от Google Mobile Test гарантирует при соблюдении указанных рекомендаций высокую оценку качества и usability (mobile friendly). Ключевые факторы алгоритма Mobile First Работа веб-разработчика при проектировании интерфейса с учетом взаимодействия мобильных пользователей с функциональностью внедряемой ИТ-системы требует знания ключевых факторов алгоритма Mobile First — точнее, технических метрик, допустимых к исполнению требований mobile friendly:


Алгоритм анализа веб-интерфейсов Mobile First 301 1. Минимальный размер шрифтов. 2. Минимальные отступы между элементами навигации. 3. Межстрочный интервал — 1,5 em (где em — единица измерения в области типографики, равная заданному в текущий момент размеру точки). 4. Допустимое время отклика после нажатия на целевую кнопку — менее 300 мс. 5. Оптимизированные форматы графики: векторная — в формате SVG, растровая — в формате WebP. «Знаю, действую, но могу забыть, и это не страшно...» Веб-разработчику достаточно знать тезисы философии mobile friendly, но не зацикливаться на полном их запоминании, поскольку инструменты веб-аналитики, такие как Google Search Console, Mobile-Friendly Test, Яндекс.Вебмастер и другие подобные веб-сервисы, помогают напомнить их и найти технические ошибки веб-дизайна и верстки в проиндексированной веб-странице сайта с учетом практически всех требований адаптивного отзывчивого дизайна веб-приложения. Допустимые размеры шрифтов Совет разработчиков Яндекс.Поиск по ранжированию веб-сайтов с учетом тезисов mobile friendly: «Мы рекомендуем использовать шрифт размером не менее 12 px». По рекомендациям Google в руководстве Material Design: минимальный размер Рис. 12.2. Размерная сетка иерархических заголовков H1–H6 в интерфейсе Google Fonts


302 Глава 12 основного текста — 16 px. Размерная сетка иерархических заголовков от H1 до H6 представлена для примера на рис. 12.2 в веб-интерфейсе Google Fonts. Рендеринг нестандартных (не входящих в базовый пакет операционной системы) шрифтов занимает некоторое время, поэтому чем больше фирменных (нестандартных) шрифтов подключено к веб-странице плюс чем больше в ней текстов с разным форматированием блоков, тем дольше браузер будет их моделировать для показа пользователю, а это соответственно ведет к появлению задержки в визуализации полной композиции веб-страницы. По умолчанию рекомендуется использовать один фирменный шрифт, унаследованный от логотипа (по требованиям в брендбуке), мелкие надписи допустимо выполнять стандартным шрифтом (например, семейства Arial). Это упростит рендеринг для полного моделирования страницы с минимальной допустимой задержкой. Отзывчивость в миллисекундах Критерий оценки пользовательского интерфейса по реакции на событие — нажатие или клик на экране характеризуются термином «отзывчивость пользовательского интерфейса» (responsive UI). Отзывчивость — это приоритет разработки ИТ-системы с веб- и мобильным интерфейсом на этапе тестирования. Исследования веб-разработчиков показали — при задержке (после клика или нажатия на кнопку) длительностью свыше 100 мс пользователь может оценить это как «торможение» реакции интерфейса. Отмечается также на практике техническое различие между касанием пальцем (finger touch on screen) и скольжением для мобильных страниц (sliding). Если фиксируемая задержка реакции интерфейса на обработку событий касания достигает 300 мс, это интерпретируется так: интерфейсы веб-приложения на мобильных устройствах реагируют медленно. Разработчики браузеров придумали эффективные решения проблемы. Для вебсайтов, где функционально масштабирование отключено, браузеры Chrome и Firefox на ОС Android также отключают функцию двойного щелчка — если сайт настроен с директивой width=device-width в метатеге: <meta name="viewport" content="width=device-width, initial-scale=1"> Браузеры с вкладками (Chrome 32 и выше) отключают масштабирование двойным щелчком, а Internet Explorer ввел новые свойства CSS для элементов touch-action, если установлено значение none для атрибута, который отменяет задержки кликов на этих элементах. Это технически фрагментарные решения, и в ИТ-сообществе используются альтернативы с применением JavaScript, в том числе заполненные указателями полифилы и сценарии для устранения этой проблемы (такие как FastClick и пр.) и автономные альтернативы (например, Kendo UI Mobile). С помощью JavaScript можно эффективно устранить проблему задержек вызова события, однако это временная мера. Решения же, основанные на возможностях


Заключение Представленные в книге методы, алгоритмы и способы анализа данных в решениях прикладных задач направлены на расширение знаний и умений начинающих ИТ-специалистов в области аналитики данных, веб-разработки и маркетинга. Разнообразие рассмотренных задач дает понять, что полученные компетенции применимы как при разработке веб-сервисов, так при отборе востребованных товаров и услуг для развития компании в сегменте B2C, а также при выработке логически и эмпирически обоснованной траектории развития стартапа (ИТ-проекта) с начала работ до расширения дополнительных услуг и микроплатежей по кросс-продажам. Важно не забывать, что полученные знания и практические умения работы с программным инструментарием обработки и анализа статистики, математического и факторного анализа не гарантируют единовременного успеха применения выработанных рекомендаций на практике. Нередко необходимо «полное погружение» в специфику рынка выбранной сферы товаров и услуг, предоставляемых по дистанционным каналам связи, для достижения рациональных и эффективных рекомендаций и решений. Как показала практика исследований, способность решать сложные задачи последовательно предельно важна и требует полной концентрации внимания вебаналитика как при сборе и анализе первичной статистики, так и при выработке гипотез и отработке их состоятельности сплит-тестами, отборе коммерческих предложений для целевой аудитории и т. п. Следует ставить тактически достижимые короткие цели (на месяц) по исполнению задач, формирующих основу для пошагового стратегического развития, при этом корректировка стратегии возможна и подчас просто необходима в условиях сложившейся ситуации на рынке потребительского спроса на товары и услуги с учетом влияния макроэкономических, социальных и политических факторов (инфляция, пандемия, санкции и пр.). Аналитику необходимо научиться на практике применять усвоенные знания и умения, используя полученные компетенции для профессионального развития, не бросать впустую начатое исследование в случае неуспеха, выявлять проблемы и кор-


348 Заключение ректировать постановку задачи и/или менять условия решения с целью достижения поставленных целей: поиска эффективных бизнес-моделей для расширения предпринимательской деятельности компании, для снижения влияния внешних факторов и улучшения технико- и эконометрических показателей исследуемой модели данных. Ну и напоследок — авторское пожелание успеха аналитикам в прикладном применении знаний на основе выработанных результатов и рекомендаций.


ПРИЛОЖЕНИЕ Описание файлового архива Файловый архив, сопровождающий книгу, выложен на сервер издательства «БХВ» по интернет-адресу: https://zip.bhv.ru/9785977518345.zip. Ссылка на него доступна и со страницы книги на сайте https://bhv.ru/. Содержимое архива приведено в табл. П.1. Таблица П.1. Содержимое электронного архива Папка, файл Описание /images Папка с цветными рисунками *.png (в ней подпапки по главам) /listings_example Папка с примерами HTML-документов *.html (в ней подпапки по главам) /listings_script Папка с примерами скриптов *.js (в ней подпапки по главам) /pdf Файлы для просмотра таблиц, схем, алгоритмов в расширенном виде


Предметный указатель S SEO-оптимизация 333, 334, 337 U UTM-метка 245 UTM-метки 92 * * * А Автоматизация воронки продаж 340, 341 Адаптивность 305 Актуальность 103, 104, 106, 107, 133, 151, 152, 154, 155, 159–161 ◊ поискового запроса 103 Алгоритм ◊ Mobile First 299, 300, 303, 305 ◊ вычисления индекса NPS 170 Анализ тональности текста 139 Б Брендбук 88 Бэкенд (backend) 53 В Виды потребительской лояльности 164 Визуальная стабильность 299 Вовлеченность аудитории 315 Воронка продаж 87, 88, 99, 115, 161, 162, 340, 342 Высокочастотный спрос 101, 102 Выход на экспоненту 107 Г Гайдлайн 88, 90 Голосовой помощник 341, 342 Градиент эмоций и частоты 134 Д Дашборд 89, 134 Декомпозиция 47–49, 51–54, 58, 59, 63, 64, 67, 68 Детракторы 171, 178, 179 Дистанционные услуги по запросу 257–259, 265 Долгосрочные тренды 294 З Задача ◊ минимизации рекламных расходов 242 ◊ о разборчивой невесте 51 И Инвестиционная привлекательность 259, 262, 267–270 Индекс потребительской лояльности (NPS) 87, 110, 165, 168, 170, 176 Интерактивность 299 К Карточка ◊ объекта недвижимости 325 ◊ товара (Item Card) 335 Ключевое сообщение 95 Ключевой запрос 142


Предметный указатель 351 Когнитивная структура 95 Когорта 168 Когортный анализ 168 Комплексный анализ 308 Конверсия 71, 72, 84, 87, 89, 97, 112–114, 120–122, 124–127, 129, 131, 132, 146, 159, 259, 273, 317, 329, 344 Концепция AIDA 115 Корпоративные информационные системы (КИС) 193 Коэффициент рентабельности 284 Краткосрочные тренды 294 Кривая Безье 78 Критерий mobile friendly 300 Л Лендинг-пейдж 67 Лид 124, 125 Лояльность 262, 265–267, 270 М Масштабирование 257, 259, 266 Матрица принятия решений 216, 217 Методология БЭМ 54–56, 58, 60, 61, 63, 68 Микроплатежи 257, 271 Микросервисы 271 Минимизация рекламных расходов 259 Мобилопригодность 303 Модель service on demand 271, 272, 293, 295, 298 Н Нейтралы 171, 178 Нивелирование рисков отказов 200 О Облако ◊ ключевых слов (Word Cloud) 133, 135–139 ◊ тегов 133, 134, 137 Отзывчивость пользовательского интерфейса (responsive UI) 302 Очередь на индексацию 150, 151 Очистка входной статистики 323 П Паттерн эмоций и частоты 134 Переиндексация 334, 345 Пирамида Маслоу 88, 99 Плотность ключевых слов на объем текста 155 Поисковая оптимизация (SEO) 142, 146, 151, 154 Покупательский спрос 101, 103, 106 Потребительская лояльность 163 Прецедент 76, 97, 100 Приоритеты 146, 159 Проверка распределения времени 181 Прогноз конверсии 159 Промоутеры 168, 169, 171, 178, 179 Р Релевантность 103 Рентабельность 258, 259, 261, 271, 281, 282, 286 ◊ услуги 281 Рефакторинг 61, 63, 64 С Сбор данных без потерь 76 Семантический анализ 133, 141, 161 Семантическое ядро 134, 142–146, 150–152, 155 Сентимент-анализ 141 Синонимы 151, 152, 154, 155, 159 Системы массового обслуживания (СМО) 189, 256 Скорость загрузки 299 Словарь интересов 273, 275, 284, 288, 296, 298 Словесный мусор 142 Сплайн 79 ◊ Катмулла–Рома 79 Средний чек 242, 256, 261, 275, 279, 280, 281, 283, 289, 295–297 Стагнация 104 Статистически значимый результат 243 Степень сплайна 79 Стоимость клика в контекстной рекламе 240 Стоп-слова 155, 157, 158 Суждение 101 Т Теория ◊ массового обслуживания 190 ◊ очередей 190


352 Предметный указатель Тепловая карта кликов 308 Требования mobile friendly 308 Триггер выбора 96, 124 У Уменьшение интенсивности отказов 200 Уникальное торговое предложение (УТП) 190, 317, 319 Уникальность ◊ индексируемой страницы 335 ◊ текста 155, 156 Услуга по запросу (service on demand) 257 Ф Факторинг 49, 51, 53 Факторный анализ 119, 121, 213–215, 218 Фронтенд (frontend) 53 Ц Целевой визит 130 Цена за клик (CPC, Cost Per Click) 316 Ценовой спрос 101, 103 Э Эффект ◊ масштаба 201 ◊ сарафанного радио 110 Ю Юнит-экономика 253, 254, 256–260, 264


Click to View FlipBook Version