Доступные модульные пайплайны

На данный момент реализованые следующие пайплайны:

Для более наглядного представления входных данных, параметров и выходных данных (откуда берутся, куда записываются и т.д.) пайплайна рекомендуется использовать команду kedro viz для визуализации пайплайнов (данная возможность доступна только при клонировании репозитория). Посмотреть описание пайплайнов также можно в коде - в директории pipelines.

Построение рекомендация на основе близости контента с использованием мешка слов

Overview

Построение рекомендаций на основе близости (похожести) контента.

Pipeline inputs

  • dataframe - csv (pandas.Dataframe), на основе которого строятся рекомендации;
  • target_column - название целевой колонки (со строковым типом вида 'Tag1, Tag2, Tag3') в pandas.Dataframe для построения рекомендаций на основе близости;
  • size - количество получаемых рекомендаций для каждой строки.

Pipeline outputs

  • dataframe_with_recs - csv (pandas.Dataframe) с дополнительной колонкой с рекомендациями.