I am implementing semi-supervised learning pipeline where one task pipeline is as follow:
S -> IMPUTER ENCODERS SEMISUPERVISED_CLASSIFIER CLASSIFIER
In this task, the SEMISUPERVISED_CLASSIFIER take CLASSIFIER as an input parameter. The following shows one of the examples generated by pipeline_search:
However, when I run the plot_comparison_pipelines. It emits an error
([{'pipeline_id': 'Pipeline #1',
'inputs': [{'name': 'input dataset'}],
'steps': [{'primitive': {'python_path': 'alpha_automl.primitives.compose.ColumnTransformer',
'name': 'primitive'},
'arguments': {'input0': {'data': 'inputs.0'}},
'outputs': [{'id': 'produce'}],
'reference': {'type': 'CONTAINER', 'data': 'steps.0.produce'},
'hyperparams': {}},
{'primitive': {'python_path': 'alpha_automl.primitives.text.CountVectorizer',
'name': 'primitive'},
'arguments': {'input0': {'data': 'steps.0.produce'}},
'outputs': [{'id': 'produce'}],
'reference': {'type': 'CONTAINER', 'data': 'steps.1.produce'},
'hyperparams': {'input': {'type': 'VALUE', 'data': 'content'},
'encoding': {'type': 'VALUE', 'data': 'utf-8'},
'decode_error': {'type': 'VALUE', 'data': 'strict'},
'strip_accents': {'type': 'VALUE', 'data': None},
'preprocessor': {'type': 'VALUE', 'data': None},
'tokenizer': {'type': 'VALUE', 'data': None},
'analyzer': {'type': 'VALUE', 'data': 'word'},
'lowercase': {'type': 'VALUE', 'data': True},
'token_pattern': {'type': 'VALUE', 'data': '(?u)\\b\\w\\w+\\b'},
'stop_words': {'type': 'VALUE', 'data': None},
'max_df': {'type': 'VALUE', 'data': 1.0},
'min_df': {'type': 'VALUE', 'data': 1},
'max_features': {'type': 'VALUE', 'data': None},
'ngram_range': {'type': 'VALUE', 'data': (1, 1)},
'vocabulary': {'type': 'VALUE', 'data': None},
'binary': {'type': 'VALUE', 'data': False},
'dtype': {'type': 'VALUE', 'data': 'int64'}}},
{'primitive': {'python_path': 'alpha_automl.primitives.builtin_primitives.SkLabelSpreading',
'name': 'primitive'},
'arguments': {'input0': {'data': 'steps.1.produce'}},
'outputs': [{'id': 'produce'}],
'reference': {'type': 'CONTAINER', 'data': 'steps.2.produce'},
'hyperparams': {}}],
'outputs': [{'data': 'steps.2.produce'}],
'pipeline_digest': 'Pipeline #1',
'start': '2023-05-25T22:19:36.858848Z',
'end': '2023-05-25T22:19:42.409235Z',
'scores': [{'metric': {'metric': 'accuracy_score'},
'value': 0.8018867924528302,
'normalized': -0.8018867924528302}],
'pipeline_source': {'name': 'Pipeline'}},
{'pipeline_id': 'Pipeline #2',
'inputs': [{'name': 'input dataset'}],
'steps': [{'primitive': {'python_path': 'alpha_automl.primitives.compose.ColumnTransformer',
'name': 'primitive'},
'arguments': {'input0': {'data': 'inputs.0'}},
'outputs': [{'id': 'produce'}],
'reference': {'type': 'CONTAINER', 'data': 'steps.0.produce'},
'hyperparams': {}},
{'primitive': {'python_path': 'alpha_automl.primitives.text.CountVectorizer',
'name': 'primitive'},
'arguments': {'input0': {'data': 'steps.0.produce'}},
'outputs': [{'id': 'produce'}],
'reference': {'type': 'CONTAINER', 'data': 'steps.1.produce'},
'hyperparams': {'input': {'type': 'VALUE', 'data': 'content'},
'encoding': {'type': 'VALUE', 'data': 'utf-8'},
'decode_error': {'type': 'VALUE', 'data': 'strict'},
'strip_accents': {'type': 'VALUE', 'data': None},
'preprocessor': {'type': 'VALUE', 'data': None},
'tokenizer': {'type': 'VALUE', 'data': None},
'analyzer': {'type': 'VALUE', 'data': 'word'},
'lowercase': {'type': 'VALUE', 'data': True},
'token_pattern': {'type': 'VALUE', 'data': '(?u)\\b\\w\\w+\\b'},
'stop_words': {'type': 'VALUE', 'data': None},
'max_df': {'type': 'VALUE', 'data': 1.0},
'min_df': {'type': 'VALUE', 'data': 1},
'max_features': {'type': 'VALUE', 'data': None},
'ngram_range': {'type': 'VALUE', 'data': (1, 1)},
'vocabulary': {'type': 'VALUE', 'data': None},
'binary': {'type': 'VALUE', 'data': False},
'dtype': {'type': 'VALUE', 'data': 'int64'}}},
{'primitive': {'python_path': 'alpha_automl.primitives.builtin_primitives.SkLabelPropagation',
'name': 'primitive'},
'arguments': {'input0': {'data': 'steps.1.produce'}},
'outputs': [{'id': 'produce'}],
'reference': {'type': 'CONTAINER', 'data': 'steps.2.produce'},
'hyperparams': {}}],
'outputs': [{'data': 'steps.2.produce'}],
'pipeline_digest': 'Pipeline #2',
'start': '2023-05-25T22:19:47.747631Z',
'end': '2023-05-25T22:19:53.377893Z',
'scores': [{'metric': {'metric': 'accuracy_score'},
'value': 0.8018867924528302,
'normalized': -0.8018867924528302}],
'pipeline_source': {'name': 'Pipeline'}},
{'pipeline_id': 'Pipeline #3',
'inputs': [{'name': 'input dataset'}],
'steps': [{'primitive': {'python_path': 'alpha_automl.primitives.compose.ColumnTransformer',
'name': 'primitive'},
'arguments': {'input0': {'data': 'inputs.0'}},
'outputs': [{'id': 'produce'}],
'reference': {'type': 'CONTAINER', 'data': 'steps.0.produce'},
'hyperparams': {}},
{'primitive': {'python_path': 'alpha_automl.primitives.text.TfidfVectorizer',
'name': 'primitive'},
'arguments': {'input0': {'data': 'steps.0.produce'}},
'outputs': [{'id': 'produce'}],
'reference': {'type': 'CONTAINER', 'data': 'steps.1.produce'},
'hyperparams': {'input': {'type': 'VALUE', 'data': 'content'},
'encoding': {'type': 'VALUE', 'data': 'utf-8'},
'decode_error': {'type': 'VALUE', 'data': 'strict'},
'strip_accents': {'type': 'VALUE', 'data': None},
'preprocessor': {'type': 'VALUE', 'data': None},
'tokenizer': {'type': 'VALUE', 'data': None},
'analyzer': {'type': 'VALUE', 'data': 'word'},
'lowercase': {'type': 'VALUE', 'data': True},
'token_pattern': {'type': 'VALUE', 'data': '(?u)\\b\\w\\w+\\b'},
'stop_words': {'type': 'VALUE', 'data': None},
'max_df': {'type': 'VALUE', 'data': 1.0},
'min_df': {'type': 'VALUE', 'data': 1},
'max_features': {'type': 'VALUE', 'data': None},
'ngram_range': {'type': 'VALUE', 'data': (1, 1)},
'vocabulary': {'type': 'VALUE', 'data': None},
'binary': {'type': 'VALUE', 'data': False},
'dtype': {'type': 'VALUE', 'data': 'float64'},
'norm': {'type': 'VALUE', 'data': 'l2'},
'use_idf': {'type': 'VALUE', 'data': True},
'smooth_idf': {'type': 'VALUE', 'data': True},
'sublinear_tf': {'type': 'VALUE', 'data': False}}},
{'primitive': {'python_path': 'alpha_automl.primitives.semi_supervised.SelfTrainingClassifier',
'name': 'primitive'},
'arguments': {'input0': {'data': 'steps.1.produce'}},
'outputs': [{'id': 'produce'}],
'reference': {'type': 'CONTAINER', 'data': 'steps.2.produce'},
'hyperparams': {'base_estimator': {'type': 'VALUE',
'data': LGBMClassifier()},
'threshold': {'type': 'VALUE', 'data': 0.75},
'criterion': {'type': 'VALUE', 'data': 'threshold'},
'k_best': {'type': 'VALUE', 'data': 10},
'max_iter': {'type': 'VALUE', 'data': 10},
'verbose': {'type': 'VALUE', 'data': False}}}],
'outputs': [{'data': 'steps.2.produce'}],
'pipeline_digest': 'Pipeline #3',
'start': '2023-05-25T22:20:01.617305Z',
'end': '2023-05-25T22:20:07.179369Z',
'scores': [{'metric': {'metric': 'accuracy_score'},
'value': 0.7962264150943397,
'normalized': -0.7962264150943397}],
'pipeline_source': {'name': 'Pipeline'}},
{'pipeline_id': 'Pipeline #4',
'inputs': [{'name': 'input dataset'}],
'steps': [{'primitive': {'python_path': 'alpha_automl.primitives.compose.ColumnTransformer',
'name': 'primitive'},
'arguments': {'input0': {'data': 'inputs.0'}},
'outputs': [{'id': 'produce'}],
'reference': {'type': 'CONTAINER', 'data': 'steps.0.produce'},
'hyperparams': {}},
{'primitive': {'python_path': 'alpha_automl.primitives.text.TfidfVectorizer',
'name': 'primitive'},
'arguments': {'input0': {'data': 'steps.0.produce'}},
'outputs': [{'id': 'produce'}],
'reference': {'type': 'CONTAINER', 'data': 'steps.1.produce'},
'hyperparams': {'input': {'type': 'VALUE', 'data': 'content'},
'encoding': {'type': 'VALUE', 'data': 'utf-8'},
'decode_error': {'type': 'VALUE', 'data': 'strict'},
'strip_accents': {'type': 'VALUE', 'data': None},
'preprocessor': {'type': 'VALUE', 'data': None},
'tokenizer': {'type': 'VALUE', 'data': None},
'analyzer': {'type': 'VALUE', 'data': 'word'},
'lowercase': {'type': 'VALUE', 'data': True},
'token_pattern': {'type': 'VALUE', 'data': '(?u)\\b\\w\\w+\\b'},
'stop_words': {'type': 'VALUE', 'data': None},
'max_df': {'type': 'VALUE', 'data': 1.0},
'min_df': {'type': 'VALUE', 'data': 1},
'max_features': {'type': 'VALUE', 'data': None},
'ngram_range': {'type': 'VALUE', 'data': (1, 1)},
'vocabulary': {'type': 'VALUE', 'data': None},
'binary': {'type': 'VALUE', 'data': False},
'dtype': {'type': 'VALUE', 'data': 'float64'},
'norm': {'type': 'VALUE', 'data': 'l2'},
'use_idf': {'type': 'VALUE', 'data': True},
'smooth_idf': {'type': 'VALUE', 'data': True},
'sublinear_tf': {'type': 'VALUE', 'data': False}}},
{'primitive': {'python_path': 'alpha_automl.primitives.semi_supervised.SelfTrainingClassifier',
'name': 'primitive'},
'arguments': {'input0': {'data': 'steps.1.produce'}},
'outputs': [{'id': 'produce'}],
'reference': {'type': 'CONTAINER', 'data': 'steps.2.produce'},
'hyperparams': {'base_estimator': {'type': 'VALUE',
'data': BernoulliNB()},
'threshold': {'type': 'VALUE', 'data': 0.75},
'criterion': {'type': 'VALUE', 'data': 'threshold'},
'k_best': {'type': 'VALUE', 'data': 10},
'max_iter': {'type': 'VALUE', 'data': 10},
'verbose': {'type': 'VALUE', 'data': False}}}],
'outputs': [{'data': 'steps.2.produce'}],
'pipeline_digest': 'Pipeline #4',
'start': '2023-05-25T22:20:07.869250Z',
'end': '2023-05-25T22:20:08.547936Z',
'scores': [{'metric': {'metric': 'accuracy_score'},
'value': 0.7886792452830189,
'normalized': -0.7886792452830189}],
'pipeline_source': {'name': 'Pipeline'}},
{'pipeline_id': 'Pipeline #5',
'inputs': [{'name': 'input dataset'}],
'steps': [{'primitive': {'python_path': 'alpha_automl.primitives.compose.ColumnTransformer',
'name': 'primitive'},
'arguments': {'input0': {'data': 'inputs.0'}},
'outputs': [{'id': 'produce'}],
'reference': {'type': 'CONTAINER', 'data': 'steps.0.produce'},
'hyperparams': {}},
{'primitive': {'python_path': 'alpha_automl.primitives.text.CountVectorizer',
'name': 'primitive'},
'arguments': {'input0': {'data': 'steps.0.produce'}},
'outputs': [{'id': 'produce'}],
'reference': {'type': 'CONTAINER', 'data': 'steps.1.produce'},
'hyperparams': {'input': {'type': 'VALUE', 'data': 'content'},
'encoding': {'type': 'VALUE', 'data': 'utf-8'},
'decode_error': {'type': 'VALUE', 'data': 'strict'},
'strip_accents': {'type': 'VALUE', 'data': None},
'preprocessor': {'type': 'VALUE', 'data': None},
'tokenizer': {'type': 'VALUE', 'data': None},
'analyzer': {'type': 'VALUE', 'data': 'word'},
'lowercase': {'type': 'VALUE', 'data': True},
'token_pattern': {'type': 'VALUE', 'data': '(?u)\\b\\w\\w+\\b'},
'stop_words': {'type': 'VALUE', 'data': None},
'max_df': {'type': 'VALUE', 'data': 1.0},
'min_df': {'type': 'VALUE', 'data': 1},
'max_features': {'type': 'VALUE', 'data': None},
'ngram_range': {'type': 'VALUE', 'data': (1, 1)},
'vocabulary': {'type': 'VALUE', 'data': None},
'binary': {'type': 'VALUE', 'data': False},
'dtype': {'type': 'VALUE', 'data': 'int64'}}},
{'primitive': {'python_path': 'alpha_automl.primitives.semi_supervised.SelfTrainingClassifier',
'name': 'primitive'},
'arguments': {'input0': {'data': 'steps.1.produce'}},
'outputs': [{'id': 'produce'}],
'reference': {'type': 'CONTAINER', 'data': 'steps.2.produce'},
'hyperparams': {'base_estimator': {'type': 'VALUE',
'data': BernoulliNB()},
'threshold': {'type': 'VALUE', 'data': 0.75},
'criterion': {'type': 'VALUE', 'data': 'threshold'},
'k_best': {'type': 'VALUE', 'data': 10},
'max_iter': {'type': 'VALUE', 'data': 10},
'verbose': {'type': 'VALUE', 'data': False}}}],
'outputs': [{'data': 'steps.2.produce'}],
'pipeline_digest': 'Pipeline #5',
'start': '2023-05-25T22:20:09.338940Z',
'end': '2023-05-25T22:20:09.984734Z',
'scores': [{'metric': {'metric': 'accuracy_score'},
'value': 0.7886792452830189,
'normalized': -0.7886792452830189}],
'pipeline_source': {'name': 'Pipeline'}},
{'pipeline_id': 'Pipeline #6',
'inputs': [{'name': 'input dataset'}],
'steps': [{'primitive': {'python_path': 'alpha_automl.primitives.compose.ColumnTransformer',
'name': 'primitive'},
'arguments': {'input0': {'data': 'inputs.0'}},
'outputs': [{'id': 'produce'}],
'reference': {'type': 'CONTAINER', 'data': 'steps.0.produce'},
'hyperparams': {}},
{'primitive': {'python_path': 'alpha_automl.primitives.text.CountVectorizer',
'name': 'primitive'},
'arguments': {'input0': {'data': 'steps.0.produce'}},
'outputs': [{'id': 'produce'}],
'reference': {'type': 'CONTAINER', 'data': 'steps.1.produce'},
'hyperparams': {'input': {'type': 'VALUE', 'data': 'content'},
'encoding': {'type': 'VALUE', 'data': 'utf-8'},
'decode_error': {'type': 'VALUE', 'data': 'strict'},
'strip_accents': {'type': 'VALUE', 'data': None},
'preprocessor': {'type': 'VALUE', 'data': None},
'tokenizer': {'type': 'VALUE', 'data': None},
'analyzer': {'type': 'VALUE', 'data': 'word'},
'lowercase': {'type': 'VALUE', 'data': True},
'token_pattern': {'type': 'VALUE', 'data': '(?u)\\b\\w\\w+\\b'},
'stop_words': {'type': 'VALUE', 'data': None},
'max_df': {'type': 'VALUE', 'data': 1.0},
'min_df': {'type': 'VALUE', 'data': 1},
'max_features': {'type': 'VALUE', 'data': None},
'ngram_range': {'type': 'VALUE', 'data': (1, 1)},
'vocabulary': {'type': 'VALUE', 'data': None},
'binary': {'type': 'VALUE', 'data': False},
'dtype': {'type': 'VALUE', 'data': 'int64'}}},
{'primitive': {'python_path': 'alpha_automl.primitives.semi_supervised.SelfTrainingClassifier',
'name': 'primitive'},
'arguments': {'input0': {'data': 'steps.1.produce'}},
'outputs': [{'id': 'produce'}],
'reference': {'type': 'CONTAINER', 'data': 'steps.2.produce'},
'hyperparams': {'base_estimator': {'type': 'VALUE',
'data': GradientBoostingClassifier()},
'threshold': {'type': 'VALUE', 'data': 0.75},
'criterion': {'type': 'VALUE', 'data': 'threshold'},
'k_best': {'type': 'VALUE', 'data': 10},
'max_iter': {'type': 'VALUE', 'data': 10},
'verbose': {'type': 'VALUE', 'data': False}}}],
'outputs': [{'data': 'steps.2.produce'}],
'pipeline_digest': 'Pipeline #6',
'start': '2023-05-25T22:21:57.988906Z',
'end': '2023-05-25T22:22:37.808992Z',
'scores': [{'metric': {'metric': 'accuracy_score'},
'value': 0.779245283018868,
'normalized': -0.779245283018868}],
'pipeline_source': {'name': 'Pipeline'}},
{'pipeline_id': 'Pipeline #7',
'inputs': [{'name': 'input dataset'}],
'steps': [{'primitive': {'python_path': 'alpha_automl.primitives.compose.ColumnTransformer',
'name': 'primitive'},
'arguments': {'input0': {'data': 'inputs.0'}},
'outputs': [{'id': 'produce'}],
'reference': {'type': 'CONTAINER', 'data': 'steps.0.produce'},
'hyperparams': {}},
{'primitive': {'python_path': 'alpha_automl.primitives.text.TfidfVectorizer',
'name': 'primitive'},
'arguments': {'input0': {'data': 'steps.0.produce'}},
'outputs': [{'id': 'produce'}],
'reference': {'type': 'CONTAINER', 'data': 'steps.1.produce'},
'hyperparams': {'input': {'type': 'VALUE', 'data': 'content'},
'encoding': {'type': 'VALUE', 'data': 'utf-8'},
'decode_error': {'type': 'VALUE', 'data': 'strict'},
'strip_accents': {'type': 'VALUE', 'data': None},
'preprocessor': {'type': 'VALUE', 'data': None},
'tokenizer': {'type': 'VALUE', 'data': None},
'analyzer': {'type': 'VALUE', 'data': 'word'},
'lowercase': {'type': 'VALUE', 'data': True},
'token_pattern': {'type': 'VALUE', 'data': '(?u)\\b\\w\\w+\\b'},
'stop_words': {'type': 'VALUE', 'data': None},
'max_df': {'type': 'VALUE', 'data': 1.0},
'min_df': {'type': 'VALUE', 'data': 1},
'max_features': {'type': 'VALUE', 'data': None},
'ngram_range': {'type': 'VALUE', 'data': (1, 1)},
'vocabulary': {'type': 'VALUE', 'data': None},
'binary': {'type': 'VALUE', 'data': False},
'dtype': {'type': 'VALUE', 'data': 'float64'},
'norm': {'type': 'VALUE', 'data': 'l2'},
'use_idf': {'type': 'VALUE', 'data': True},
'smooth_idf': {'type': 'VALUE', 'data': True},
'sublinear_tf': {'type': 'VALUE', 'data': False}}},
{'primitive': {'python_path': 'alpha_automl.primitives.semi_supervised.SelfTrainingClassifier',
'name': 'primitive'},
'arguments': {'input0': {'data': 'steps.1.produce'}},
'outputs': [{'id': 'produce'}],
'reference': {'type': 'CONTAINER', 'data': 'steps.2.produce'},
'hyperparams': {'base_estimator': {'type': 'VALUE',
'data': GradientBoostingClassifier()},
'threshold': {'type': 'VALUE', 'data': 0.75},
'criterion': {'type': 'VALUE', 'data': 'threshold'},
'k_best': {'type': 'VALUE', 'data': 10},
'max_iter': {'type': 'VALUE', 'data': 10},
'verbose': {'type': 'VALUE', 'data': False}}}],
'outputs': [{'data': 'steps.2.produce'}],
'pipeline_digest': 'Pipeline #7',
'start': '2023-05-25T22:20:58.555729Z',
'end': '2023-05-25T22:21:57.984417Z',
'scores': [{'metric': {'metric': 'accuracy_score'},
'value': 0.7735849056603774,
'normalized': -0.7735849056603774}],
'pipeline_source': {'name': 'Pipeline'}},
{'pipeline_id': 'Pipeline #8',
'inputs': [{'name': 'input dataset'}],
'steps': [{'primitive': {'python_path': 'alpha_automl.primitives.compose.ColumnTransformer',
'name': 'primitive'},
'arguments': {'input0': {'data': 'inputs.0'}},
'outputs': [{'id': 'produce'}],
'reference': {'type': 'CONTAINER', 'data': 'steps.0.produce'},
'hyperparams': {}},
{'primitive': {'python_path': 'alpha_automl.primitives.text.TfidfVectorizer',
'name': 'primitive'},
'arguments': {'input0': {'data': 'steps.0.produce'}},
'outputs': [{'id': 'produce'}],
'reference': {'type': 'CONTAINER', 'data': 'steps.1.produce'},
'hyperparams': {'input': {'type': 'VALUE', 'data': 'content'},
'encoding': {'type': 'VALUE', 'data': 'utf-8'},
'decode_error': {'type': 'VALUE', 'data': 'strict'},
'strip_accents': {'type': 'VALUE', 'data': None},
'preprocessor': {'type': 'VALUE', 'data': None},
'tokenizer': {'type': 'VALUE', 'data': None},
'analyzer': {'type': 'VALUE', 'data': 'word'},
'lowercase': {'type': 'VALUE', 'data': True},
'token_pattern': {'type': 'VALUE', 'data': '(?u)\\b\\w\\w+\\b'},
'stop_words': {'type': 'VALUE', 'data': None},
'max_df': {'type': 'VALUE', 'data': 1.0},
'min_df': {'type': 'VALUE', 'data': 1},
'max_features': {'type': 'VALUE', 'data': None},
'ngram_range': {'type': 'VALUE', 'data': (1, 1)},
'vocabulary': {'type': 'VALUE', 'data': None},
'binary': {'type': 'VALUE', 'data': False},
'dtype': {'type': 'VALUE', 'data': 'float64'},
'norm': {'type': 'VALUE', 'data': 'l2'},
'use_idf': {'type': 'VALUE', 'data': True},
'smooth_idf': {'type': 'VALUE', 'data': True},
'sublinear_tf': {'type': 'VALUE', 'data': False}}},
{'primitive': {'python_path': 'alpha_automl.primitives.builtin_primitives.SkLabelSpreading',
'name': 'primitive'},
'arguments': {'input0': {'data': 'steps.1.produce'}},
'outputs': [{'id': 'produce'}],
'reference': {'type': 'CONTAINER', 'data': 'steps.2.produce'},
'hyperparams': {}}],
'outputs': [{'data': 'steps.2.produce'}],
'pipeline_digest': 'Pipeline #8',
'start': '2023-05-25T22:19:42.414144Z',
'end': '2023-05-25T22:19:47.452415Z',
'scores': [{'metric': {'metric': 'accuracy_score'},
'value': 0.7358490566037735,
'normalized': -0.7358490566037735}],
'pipeline_source': {'name': 'Pipeline'}},
{'pipeline_id': 'Pipeline #9',
'inputs': [{'name': 'input dataset'}],
'steps': [{'primitive': {'python_path': 'alpha_automl.primitives.compose.ColumnTransformer',
'name': 'primitive'},
'arguments': {'input0': {'data': 'inputs.0'}},
'outputs': [{'id': 'produce'}],
'reference': {'type': 'CONTAINER', 'data': 'steps.0.produce'},
'hyperparams': {}},
{'primitive': {'python_path': 'alpha_automl.primitives.text.TfidfVectorizer',
'name': 'primitive'},
'arguments': {'input0': {'data': 'steps.0.produce'}},
'outputs': [{'id': 'produce'}],
'reference': {'type': 'CONTAINER', 'data': 'steps.1.produce'},
'hyperparams': {'input': {'type': 'VALUE', 'data': 'content'},
'encoding': {'type': 'VALUE', 'data': 'utf-8'},
'decode_error': {'type': 'VALUE', 'data': 'strict'},
'strip_accents': {'type': 'VALUE', 'data': None},
'preprocessor': {'type': 'VALUE', 'data': None},
'tokenizer': {'type': 'VALUE', 'data': None},
'analyzer': {'type': 'VALUE', 'data': 'word'},
'lowercase': {'type': 'VALUE', 'data': True},
'token_pattern': {'type': 'VALUE', 'data': '(?u)\\b\\w\\w+\\b'},
'stop_words': {'type': 'VALUE', 'data': None},
'max_df': {'type': 'VALUE', 'data': 1.0},
'min_df': {'type': 'VALUE', 'data': 1},
'max_features': {'type': 'VALUE', 'data': None},
'ngram_range': {'type': 'VALUE', 'data': (1, 1)},
'vocabulary': {'type': 'VALUE', 'data': None},
'binary': {'type': 'VALUE', 'data': False},
'dtype': {'type': 'VALUE', 'data': 'float64'},
'norm': {'type': 'VALUE', 'data': 'l2'},
'use_idf': {'type': 'VALUE', 'data': True},
'smooth_idf': {'type': 'VALUE', 'data': True},
'sublinear_tf': {'type': 'VALUE', 'data': False}}},
{'primitive': {'python_path': 'alpha_automl.primitives.builtin_primitives.SkLabelPropagation',
'name': 'primitive'},
'arguments': {'input0': {'data': 'steps.1.produce'}},
'outputs': [{'id': 'produce'}],
'reference': {'type': 'CONTAINER', 'data': 'steps.2.produce'},
'hyperparams': {}}],
'outputs': [{'data': 'steps.2.produce'}],
'pipeline_digest': 'Pipeline #9',
'start': '2023-05-25T22:19:53.382010Z',
'end': '2023-05-25T22:19:58.156724Z',
'scores': [{'metric': {'metric': 'accuracy_score'},
'value': 0.7339622641509433,
'normalized': -0.7339622641509433}],
'pipeline_source': {'name': 'Pipeline'}}],
{'alpha_automl.primitives.preprocessing.OneHotEncoder': 'Categorical Encoder',
'alpha_automl.primitives.discriminant_analysis.LinearDiscriminantAnalysis': 'Classifier',
'alpha_automl.primitives.discriminant_analysis.QuadraticDiscriminantAnalysis': 'Classifier',
'alpha_automl.primitives.ensemble.BaggingClassifier': 'Classifier',
'alpha_automl.primitives.ensemble.ExtraTreesClassifier': 'Classifier',
'alpha_automl.primitives.ensemble.GradientBoostingClassifier': 'Classifier',
'alpha_automl.primitives.ensemble.RandomForestClassifier': 'Classifier',
'alpha_automl.primitives.naive_bayes.BernoulliNB': 'Classifier',
'alpha_automl.primitives.naive_bayes.GaussianNB': 'Classifier',
'alpha_automl.primitives.naive_bayes.MultinomialNB': 'Classifier',
'alpha_automl.primitives.neighbors.KNeighborsClassifier': 'Classifier',
'alpha_automl.primitives.linear_model.LogisticRegression': 'Classifier',
'alpha_automl.primitives.linear_model.PassiveAggressiveClassifier': 'Classifier',
'alpha_automl.primitives.linear_model.SGDClassifier': 'Classifier',
'alpha_automl.primitives.svm.LinearSVC': 'Classifier',
'alpha_automl.primitives.svm.SVC': 'Classifier',
'alpha_automl.primitives.tree.DecisionTreeClassifier': 'Classifier',
'alpha_automl.primitives.xgboost.XGBClassifier': 'Classifier',
'alpha_automl.primitives.lightgbm.LGBMClassifier': 'Classifier',
'alpha_automl.primitives.cluster.KMeans': 'Clusterer',
'alpha_automl.primitives.cluster.AgglomerativeClustering': 'Clusterer',
'alpha_automl.primitives.preprocessing.OrdinalEncoder': 'Datetime Encoder',
'alpha_automl.primitives.builtin_primitives.CyclicalFeature': 'Datetime Encoder',
'alpha_automl.primitives.builtin_primitives.Datetime64ExpandEncoder': 'Datetime Encoder',
'alpha_automl.primitives.builtin_primitives.DummyEncoder': 'Datetime Encoder',
'alpha_automl.primitives.preprocessing.MaxAbsScaler': 'Feature Scaler',
'alpha_automl.primitives.preprocessing.RobustScaler': 'Feature Scaler',
'alpha_automl.primitives.preprocessing.StandardScaler': 'Feature Scaler',
'alpha_automl.primitives.feature_selection.GenericUnivariateSelect': 'Feature Selector',
'alpha_automl.primitives.feature_selection.SelectPercentile': 'Feature Selector',
'alpha_automl.primitives.feature_selection.SelectKBest': 'Feature Selector',
'alpha_automl.primitives.impute.SimpleImputer': 'Imputer',
'alpha_automl.primitives.linear_model.ARDRegression': 'Regressor',
'alpha_automl.primitives.tree.DecisionTreeRegressor': 'Regressor',
'alpha_automl.primitives.ensemble.ExtraTreesRegressor': 'Regressor',
'alpha_automl.primitives.gaussian_process.GaussianProcessRegressor': 'Regressor',
'alpha_automl.primitives.ensemble.GradientBoostingRegressor': 'Regressor',
'alpha_automl.primitives.neighbors.KNeighborsRegressor': 'Regressor',
'alpha_automl.primitives.linear_model.Lars': 'Regressor',
'alpha_automl.primitives.linear_model.Lasso': 'Regressor',
'alpha_automl.primitives.linear_model.LassoCV': 'Regressor',
'alpha_automl.primitives.svm.LinearSVR': 'Regressor',
'alpha_automl.primitives.linear_model.PassiveAggressiveRegressor': 'Regressor',
'alpha_automl.primitives.ensemble.RandomForestRegressor': 'Regressor',
'alpha_automl.primitives.linear_model.Ridge': 'Regressor',
'alpha_automl.primitives.linear_model.SGDRegressor': 'Regressor',
'alpha_automl.primitives.svm.SVR': 'Regressor',
'alpha_automl.primitives.linear_model.BayesianRidge': 'Regressor',
'alpha_automl.primitives.linear_model.ElasticNet': 'Regressor',
'alpha_automl.primitives.linear_model.HuberRegressor': 'Regressor',
'alpha_automl.primitives.linear_model.LinearRegression': 'Regressor',
'alpha_automl.primitives.linear_model.RANSACRegressor': 'Regressor',
'alpha_automl.primitives.linear_model.RidgeCV': 'Regressor',
'alpha_automl.primitives.linear_model.TheilSenRegressor': 'Regressor',
'alpha_automl.primitives.xgboost.XGBRegressor': 'Regressor',
'alpha_automl.primitives.lightgbm.LGBMRegressor': 'Regressor',
'alpha_automl.primitives.text.CountVectorizer': 'Text Encoder',
'alpha_automl.primitives.text.TfidfVectorizer': 'Text Encoder',
'alpha_automl.primitives.compose.ColumnTransformer': 'Column Transformer',
'alpha_automl.primitives.semi_supervised.SelfTrainingClassifier': 'Semisupervised Classifier',
'alpha_automl.primitives.builtin_primitives.SkLabelSpreading': 'Labelpropagation Classifier',
'alpha_automl.primitives.builtin_primitives.SkLabelPropagation': 'Labelpropagation Classifier'})