匠心精神 - 良心品质腾讯认可的专业机构-IT人的高薪实战学院

咨询电话:4000806560

【Python机器学习】如何用Sklearn构建简单的分类器?

【Python机器学习】如何用Sklearn构建简单的分类器?

代码示例:

```python
from sklearn.datasets import load_iris
from sklearn.tree import DecisionTreeClassifier
from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score

# 加载数据集
iris = load_iris()
# 提取特征和标签
X = iris.data
y = iris.target
# 划分训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)
# 初始化决策树分类器
clf = DecisionTreeClassifier()
# 拟合数据
clf.fit(X_train, y_train)
# 预测测试集
y_pred = clf.predict(X_test)
# 计算准确率
acc = accuracy_score(y_test, y_pred)
print("Accuracy: {}".format(acc))
```

在这个示例中使用的数据集是Iris数据集,这是一个非常常见的分类问题。可以使用sklearn自带的数据集模块`load_iris`读取数据集。数据集包含150个样本,由iris物种的花萼长度、花萼宽度、花瓣长度和花瓣宽度构成。这个任务就是预测每一个花卉的物种。数据集中有三种物种,分别是Iris Setosa、Iris Versicolour和Iris Virginica,每种物种有50个样本。

在代码中,我们将数据集分为训练集和测试集。`train_test_split`函数用于将数据集分为训练集和测试集。`test_size`参数是用于指定测试集数据占总数据的比例。`random_state`参数是用于指定随机种子,这个可以用于固定数据集的划分结果以便重复实验。

接下来,我们初始化一个决策树分类器。决策树是一种基于树结构的分类算法。它通过不断地对特征进行二分来生成决策树,从而实现分类。在sklearn中,可以使用`DecisionTreeClassifier`来初始化决策树分类器。

然后,我们使用训练数据集对分类器进行拟合。拟合是指使用训练数据集来训练分类器,让分类器能够预测新数据的结果。在sklearn中,可以使用`fit`函数来进行拟合操作。

最后,我们使用测试数据集来测试分类器的准确性。在这里,我们使用`accuracy_score`函数来计算分类器在测试数据集上的准确率。准确率是指分类器正确预测结果的比例。在这个示例中,我们输出了分类器的准确率。

在本示例中,我们使用了sklearn的一些基本功能,包括载入数据集、拆分数据集、初始化分类器、拟合数据集以及计算准确率等操作。这些操作都是非常基础的机器学习任务,但是对于初学者来说是非常重要的。希望这篇文章对需要入门Python机器学习的新手有所帮助。