【Python机器学习】如何用Sklearn构建简单的分类器? 代码示例: ```python from sklearn.datasets import load_iris from sklearn.tree import DecisionTreeClassifier from sklearn.model_selection import train_test_split from sklearn.metrics import accuracy_score # 加载数据集 iris = load_iris() # 提取特征和标签 X = iris.data y = iris.target # 划分训练集和测试集 X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42) # 初始化决策树分类器 clf = DecisionTreeClassifier() # 拟合数据 clf.fit(X_train, y_train) # 预测测试集 y_pred = clf.predict(X_test) # 计算准确率 acc = accuracy_score(y_test, y_pred) print("Accuracy: {}".format(acc)) ``` 在这个示例中使用的数据集是Iris数据集,这是一个非常常见的分类问题。可以使用sklearn自带的数据集模块`load_iris`读取数据集。数据集包含150个样本,由iris物种的花萼长度、花萼宽度、花瓣长度和花瓣宽度构成。这个任务就是预测每一个花卉的物种。数据集中有三种物种,分别是Iris Setosa、Iris Versicolour和Iris Virginica,每种物种有50个样本。 在代码中,我们将数据集分为训练集和测试集。`train_test_split`函数用于将数据集分为训练集和测试集。`test_size`参数是用于指定测试集数据占总数据的比例。`random_state`参数是用于指定随机种子,这个可以用于固定数据集的划分结果以便重复实验。 接下来,我们初始化一个决策树分类器。决策树是一种基于树结构的分类算法。它通过不断地对特征进行二分来生成决策树,从而实现分类。在sklearn中,可以使用`DecisionTreeClassifier`来初始化决策树分类器。 然后,我们使用训练数据集对分类器进行拟合。拟合是指使用训练数据集来训练分类器,让分类器能够预测新数据的结果。在sklearn中,可以使用`fit`函数来进行拟合操作。 最后,我们使用测试数据集来测试分类器的准确性。在这里,我们使用`accuracy_score`函数来计算分类器在测试数据集上的准确率。准确率是指分类器正确预测结果的比例。在这个示例中,我们输出了分类器的准确率。 在本示例中,我们使用了sklearn的一些基本功能,包括载入数据集、拆分数据集、初始化分类器、拟合数据集以及计算准确率等操作。这些操作都是非常基础的机器学习任务,但是对于初学者来说是非常重要的。希望这篇文章对需要入门Python机器学习的新手有所帮助。