使用lr预设的基本流程如下:
1. 选择合适的LR模型:根据具体的问题选择使用标准的LR、多元逻辑回归或者默认的sklearn.linear_model.LogisticRegression等,确定合适的损失函数等参数。
2. 数据处理:对模型的数据进行清洗和预处理,包括特征选择、缺失值填补等步骤。
3. 参数配置:在train函数中,可以通过传入参数来指定不同的预设方式。其中最常见的包括solver(优化算法)、penalty(正则化类型)、C(正则强度)等。
4. 模型训练:将处理后的数据传入训练函数fit中,进行模型拟合。
5. 模型调参:通过交叉验证等方法,确定最优的参数组合。参数的选择需要根据具体情况进行,一般会在一个区间内进行搜索例如使用GridSearchCV类,设置不同的惩罚项和C值,然后使用交叉验证选择模型表现最好的一组参数。
6. 模型预测:完成模型训练后,使用构建的模型对新数据进行预测。当有新的数据到来时,可以直接predict方法对其进行分类。