Доступные модульные пайплайны
На данный момент реализованые следующие пайплайны:
Для более наглядного представления входных данных, параметров и выходных данных (откуда берутся, куда записываются и т.д.) пайплайна рекомендуется использовать команду kedro viz
для визуализации пайплайнов (данная возможность доступна только при клонировании репозитория). Посмотреть описание пайплайнов также можно в коде - в директории pipelines
.
Построение рекомендация на основе близости контента с использованием мешка слов
Overview
Построение рекомендаций на основе близости (похожести) контента.
Pipeline inputs
- dataframe - csv (pandas.Dataframe), на основе которого строятся рекомендации;
- target_column - название целевой колонки (со строковым типом вида
'Tag1, Tag2, Tag3'
) в pandas.Dataframe для построения рекомендаций на основе близости; - size - количество получаемых рекомендаций для каждой строки.
Pipeline outputs
- dataframe_with_recs - csv (pandas.Dataframe) с дополнительной колонкой с рекомендациями.