1.概述

任务依旧是文本分类,大模型选用的是通义千问72B-chat-int4。这里不对参数进行调整,只讲述不同prompt对于结果及其准确度的影响。数据使用之前数据清理的铁矿石文本。

写的非常零碎,只作为个人学习记录,因为服务器莫名掉线,一晚上程序白写,文章后期就摆烂了....仅供参考。

2.调试过程记录

2.1任务初始化

response, history = model.chat(tokenizer,'''1	价格	商品的境外产品价格、境内产品价格及综合价格指数
2	供应端	商品供应端的产量和产能
3	需求端	下游企业的商品消耗量
4	仓储(库存)	一定时点上停留在流通领域内的全部商品
5	产业链	从原料到消费者手中的整个产业链条中的相关商品价格
6	成本	对购买的生产要素的货币支出
7	利润	企业在一定会计期间的经营成果
8	生产的经济技术指标	反映生产技术水平和经济的某一方面情况的绝对数、相对数或平均数
9	物流	物品从供应地向接收地的实体流动过程
10	交易	商品的购售买卖行为
11	进口	我国在一定时期内进口某种商品的数量和价格
12	出口	我国在一定时期内出口某种商品的数量和价格
13	国际影响	与本品种相关的主要国家动态及政策的影响分析
14	客户	品种的使用群体、企业的经营状况
15	衍生品市场	以某种商品为标的的衍生品市场
16	机构	为实现其职能而建立起来的机关体系的总称,主要包括国内外协会、国际联盟、咨询公司的动态、研报
17	舆情(情绪)	通过调研获取到市场参与者对大宗商品现货品种的方向性的情绪态度
18	宏观经济	整个国民经济或国民经济总体及其经济活动和运行状态
19	宏观政策	根据社会系统的需要,社会公众权威制定的行动方案或行动准则
20	意外灾害(自然灾害、事故)	突然发生,造成或者可能造成严重社会危害,需要采取应急处置措施予以应对的自然灾害和事故
21	气象(天气)	发生在大气中的各种自然现象
22	事件	国内宏观、国际、企业、行业、资本市场所发生的与本品种相关的事件
总共是这22类,上面提供了类别名称及其定义。''' , history=None,system="你现在需要做一个文本分类任务,文本可能属于分类中的一个或多个")
print(response)

通过system指定任务,并使用content扩充其知识库,history置零。

这其实进行了多次试验,如果将输出目标放在这段对话里,最后输出类别数量可能减少并出现其他类别,如下。

该文本属于以下类别:

价格:文中提到了庐江和繁昌地区的铁精粉价格。

供应端:文中讨论了连铁走势对供应端的心态提振作用,以及庐江地区矿企的让利出货策略。

需求端:文中提到钢企的观望心态和补库完成导致询盘积极性减弱,市场需求受到影响。

铁精粉:文中主要讨论的是铁精粉的价格和市场情况。

综上所述,该文本所属的类别包括价格、供应端、需求端和铁精粉。

所以使用这一初始化prompt

在这一初始化下输出如下:

好的,我明白了。这是一个文本分类任务,您需要将文本分类为上述22个类别中的一个或多个。我会尽力帮助您完成这个任务。请提供一些示例文本,以便我可以更好地理解您的需求并开始为您服务。

2.2具体任务

先从短文本开始试验不同prompt效果。

response, history = model.chat(tokenizer, '''【黑色持仓日报丨钢坯上5000,螺纹钢期货大涨3.7%】4月2日,唐山钢坯连续上涨,主流钢厂(XD)出厂累涨150元/吨,达到5000元/吨。现货市场连续上涨,带动黑色系期货走高。截止收盘,螺纹2105收5157,涨3.70%;热卷2105收5556,涨2.47%;铁矿石2109收979,涨1.77%。
                               请分别判断这段文本是否属于各个类别,并最终输出该文本所属的所有类别。''', history=history)
print(response)

后面就不再以代码形式展示,只改变文字prompt部分。

2.2.1直接询问

请输出上述文本分别属于每个类别的概率,并最终选择概率大于50%的类别输出。

这段文本可以被归类为以下类别: 供应端 (78.36%), 需求端 (21.64%)。

供应端:78.36%

需求端:21.64%

由于供应端的概率大于50%,所以最终选择的类别为供应端。

这段文本描述了多个市场的供应情况,包括铁精粉市场、进口矿市场、镍矿市场、生铁市场、废钢市场、方坯市场、煤炭市场以及焦炭市场。这些市场中,各个产品的价格、产量、报价等方面的信息都是围绕供应方面的内容展开讨论的。例如,文中提到“供应端,近日连铁持续偏强,繁昌在产选厂心态提振,且因原料成本不断升高报价继续上探”、“进口矿市场走势平稳,成交情况不佳”等,都涉及到市场供应的情况。同时,也有部分信息提到了需求端的情况,比如“需求端,近期连铁持续走强,钢企观望心态渐浓,叠加部分钢企补库完成,询盘积极性有所减弱,整体市场交投氛围降温”。

请分别判断这段文本是否属于各个类别,并最终输出该文本所属的所有类别。

该文本属于以下类别: 价格:文中提到了庐江和繁昌地区的铁精粉价格。 供应端:文中讨论了连铁走势对供应端的心态提振作用,以及庐江地区矿企的让利出货策略。 需求端:文中提到钢企的观望心态和补库完成导致询盘积极性减弱,市场需求受到影响。 铁精粉:文中主要讨论的是铁精粉的价格和市场情况。 综上所述,该文本所属的类别包括价格、供应端、需求端和铁精粉。

这段文本可以被归类为以下类别: 供应端 (78.36%), 需求端 (21.64%)。 供应端:78.36% 需求端:21.64% 由于供应端的概率大于50%,所以最终选择的类别为供应端。 这段文本描述了多个市场的供应情况,包括铁精粉市场、进口矿市场、镍矿市场、生铁市场、废钢市场、方坯市场、煤炭市场以及焦炭市场。这些市场中,各个产品的价格、产量、报价等方面的信息都是围绕供应方面的内容展开讨论的。例如,文中提到“供应端,近日连铁持续偏强,繁昌在产选厂心态提振,且因原料成本不断升高报价继续上探”、“进口矿市场走势平稳,成交情况不佳”等,都涉及到市场供应的情况。同时,也有部分信息提到了需求端的情况,比如“需求端,近期连铁持续走强,钢企观望心态渐浓,叠加部分钢企补库完成,询盘积极性有所减弱,整体市场交投氛围降温”。

属于“价格”、“供应端”、“需求端”、“仓储(库存)”、“产业链”、“物流”、“交易”、“进口”、“出口”、“国际影响”、“客户”、“衍生品市场”、“机构”、“舆情(情绪)”、“宏观经济”、“宏观政策”、“意外灾害(自然灾害、事故)”、“气象(天气)”、“事件”等类别。

可以看出结果并不是很好,甚至第二个prompt的回答已经完全放弃了推理,变得毫无逻辑。所以考虑使用示例的方式。

2.2.2示例prompt方式

下面是一个可供学习的分类案例。

文本:Mysteel解读:2024年一季度全国铁矿山企业精粉产量解读 Mysteel统计一季度全国332家铁矿山企业铁精粉日均产量为6562万吨,日均产量75.55万吨,同比日均增5.3万吨,增幅7.5%。由下图可见,今年一季度走势依旧符合历年来的历史趋势,一季度内春节活动对矿山开工影响较大,且处于前期深冬季节,部分极端天气影响企业生产,国产铁精粉产量先降后增,下面我们详细进行分析。 原矿与精粉官方数据统计表 统计局原矿产量(万吨)中矿协重点企业产量(万吨)钢联精粉产量(万吨)原矿精粉1月 3373.561086.252178.12月17586(1-2月份总量)3110.211029.512041.53月---2342.2 1月至2月精粉日度精粉产量受假期和天气影响,增产较少同比去年增加0.52万吨,而春节后矿山企业陆续复产,月份日度精粉产量75.55万吨,同比去年3月日均精粉产量增加0.95万吨。分区域来说,分区域来看,一季度精粉产量变动较的大有5个省份,分别是安徽、河北、辽宁、山东、四川、新疆。1月份安徽6家企业受当地政策影响停产减产,影响日均产量减少0.13万吨,2、3月份逐步回升环比1月份日均产量增加0.12万吨;2月份随着春节临近,影响部分企业正常生产,河北7家企业有停产减产,影响日均产量减少1.42万吨,3月份河北精粉日均产量逐步回升0.89万吨;2月份辽宁8家企业月内生产不稳定,日均精粉产量减少0.77万吨,3月份市场行情较差,且对周围市场几无价差,辽宁铁精粉资源外流受限,矿山生产积极性较差,几无复产操作,整体增量少于预期,故3月份辽宁精粉日均产量环比2月份增加0.17万吨;自春节前山东12家矿企完成年度目标停产减产后,2月份精粉日均产量减少0.95万吨,3月份多数矿企恢复正常生产状态,日均精粉产量增加0.74万吨;2月份新疆11家企业受极端天气以及春节假期影响停产,精粉日均产量减少0.87万吨,3月份随着天气回暖,4家企业恢复正常生产状态,3月份环比2月份日均产量增加0.5万吨。 分企业规模来看,一季度大型矿企月度精粉产量先增后降,2月份产量环比1月份精粉日均产量减少约2.86万吨,3月份大型矿企精粉日均产量增加4.78万吨;中型企业2月份产量环比1月减少1.13万吨,至3月份基本恢复至正常水准,3月份精粉产量环比2月增加1.01万吨,总产量较1月基本持平;小型企业产量下降后不但没有恢复,随着市场价格走弱,产量进一步减少,3月环比1月份日均产量下降约2.06万吨。由此可见,大中型企业在经历假期影响后均恢复正常生产状态,而小型企业受市场影响较大,复产较困难。 展望下期:二季度考虑季节性因素或呈现先增后降趋势,往年两个月度精粉产量高峰分别出现在一季度的3月份和三季度的8月份。而今年3月份虽然也遵循了复产趋势,但远远未达到往年水平,4、5月份预计产量会进一步增加,6月份会有所减少,预计二季度精粉产量增加400万吨左右。4月份河北、辽宁、山东、新疆等4个省份6个企业有复产计划,6家复产企业满产后日均产量增加1万吨,但考虑到4月份与3月份生产天数差异,4月月度精粉产量2300万吨左右。5月份随着终端需求释放预计会支撑原料需求增加,矿山生产积极性提高,部分大型企业达到满产状态,且部分中小型企业恢复至正常生产,精粉日均产量增加0.1万吨,且随着5月份生产天数增加,精粉产量预计2380万吨左右。6月暑期来临加之市场传统淡季来临,市场需求减弱,部分矿山企业生产受到影响,预计6月份精粉日均产量减少1.1万吨,6月份精粉产量2270万吨左右。注:Mysteel全国铁矿山企业精粉产量涵盖样本433家,覆盖26省,原矿展能10.5亿吨左右,铁精粉产能3.5亿吨,约占全国的95%左右。以上数据不包含新增产能,新增产能分布在安徽、河北、辽宁、山东、山西、四川、云南等7个省份,预计15个项目,影响约980万吨产量,预计4月份投产1个项目,年产能约100吨。

输出结果:根据提供的文本内容和先前定义的22个类别,我们可以将这段文本进行如下分类:

价格:文本中提到了铁精粉的产量和生产状态,这些信息可以间接影响到价格,但文本本身并不直接讨论价格。

供应端:文本详细讨论了不同地区和不同规模的铁矿山企业的铁精粉产量,属于供应端类别。

需求端:文本没有直接讨论下游企业的商品消耗量,但提到了市场行情和需求释放,可以认为与需求端有间接关联。

仓储(库存):文本没有提到具体的库存情况。

产业链:文本通过讨论产量和生产状态,间接涉及到了铁精粉的产业链。

成本:文本没有直接提到成本信息。

利润:文本没有直接提到企业的利润情况。

生产的经济技术指标:文本提供了产量、停产减产等生产活动的数据,属于生产的经济技术指标类别。

物流:文本没有直接讨论物流情况。

交易:文本没有直接讨论交易行为。

进口:文本没有提到进口情况。

出口:文本没有提到出口情况。

国际影响:文本聚焦于国内铁矿山企业,没有提到国际影响。

客户:文本没有直接提到使用群体或企业经营状况。

衍生品市场:文本没有提到衍生品市场。

机构:文本提到了Mysteel和中矿协等机构的统计数据,可以归入机构类别。

舆情(情绪):文本没有直接调研市场参与者的情绪态度。

宏观经济:文本没有直接讨论宏观经济情况。

宏观政策:文本提到了政策影响,如当地政策影响停产减产,可以归入宏观政策类别。

意外灾害(自然灾害、事故):文本提到了极端天气对生产的影响,可以归入此类别。

气象(天气):文本提到了春节和极端天气,可以归入气象类别。

事件:文本中提到了春节活动和天气事件对生产的影响,可以归入事件类别。

综上所述,该文本主要属于以下类别:

供应端;产业链;生产的经济技术指标;需求端;机构;宏观政策;意外灾害(自然灾害、事故);气象(天气);事件

提供了上述示例(由kimi生成)。

更改的prompt

请判断这段文本是否属于定义的22个类别,并输出该文本所属的所有类别。

输出结果:

是的,这段文本属于以下类别:

价格:提到了庐江和繁昌地区的铁精粉报价。

供需:描述了安徽国产铁精粉市场的供应和需求情况。

仓库(库存):没有提及库存情况。

产业链:提到了铁精粉的价格受到连铁行情的影响,反映了铁精粉和其他产品的产业链关系。

成本:提到了矿企的成本上升,从而推动了报价上涨。

利润:没有提及利润情况。 生产技术经济指标:没有提及具体的生产技术经济指标。

物流:没有提及物流情况。

交易:没有提及具体交易情况。

进口:没有提及进口情况。

出口:没有提及出口情况。

国际影响:没有提及国际影响。

客户:提到了钢企的需求情况。

衍生品市场:提到了连铁市场对铁精粉价格的影响。

机构:没有提及特定的机构。

舆情(情绪):提到了市场交投氛围的变化。

宏观经济:没有提及宏观经济情况。

宏观政策:没有提及宏观政策。

意外灾害(自然灾害、事故):没有提及意外灾害情况。

气象(天气):没有提及气象情况。

事件:提到了连铁行情对铁精粉价格的影响。

基本还不错,但是擅自把供需合在一起了。

3.结论

在均为zero shot的情况下,kimi和qwen的可靠性都不高,需要进一步调整。最后通过修改初始化程序的prompt达到了较好的输出效果,但结果可信度需要数据集的辅助,以我浅薄的理解,两者的可信度好像都不是很高,┓( ´∀` )┏。

response, history = model.chat(tokenizer,'''根据不同文本,判断其是否属于以下22个类别中的一个或多个。
                               1	价格	商品的境外产品价格、境内产品价格及综合价格指数
2	供应端	商品供应端的产量和产能
3	需求端	下游企业的商品消耗量
4	仓储(库存)	一定时点上停留在流通领域内的全部商品
5	产业链	从原料到消费者手中的整个产业链条中的相关商品价格
6	成本	对购买的生产要素的货币支出
7	利润	企业在一定会计期间的经营成果
8	生产的经济技术指标	反映生产技术水平和经济的某一方面情况的绝对数、相对数或平均数
9	物流	物品从供应地向接收地的实体流动过程
10	交易	商品的购售买卖行为
11	进口	我国在一定时期内进口某种商品的数量和价格
12	出口	我国在一定时期内出口某种商品的数量和价格
13	国际影响	与本品种相关的主要国家动态及政策的影响分析
14	客户	品种的使用群体、企业的经营状况
15	衍生品市场	以某种商品为标的的衍生品市场
16	机构	为实现其职能而建立起来的机关体系的总称,主要包括国内外协会、国际联盟、咨询公司的动态、研报
17	舆情(情绪)	通过调研获取到市场参与者对大宗商品现货品种的方向性的情绪态度
18	宏观经济	整个国民经济或国民经济总体及其经济活动和运行状态
19	宏观政策	根据社会系统的需要,社会公众权威制定的行动方案或行动准则
20	意外灾害(自然灾害、事故)	突然发生,造成或者可能造成严重社会危害,需要采取应急处置措施予以应对的自然灾害和事故
21	气象(天气)	发生在大气中的各种自然现象
22	事件	国内宏观、国际、企业、行业、资本市场所发生的与本品种相关的事件
总共是这22类,上面提供了类别名称及其定义。''' , 
                               history=None,
                               system='''你现在需要做一个文本分类任务,文本可能属于分类中的一个或多。''')
print(response)

输出:

这个文本主要涉及到了以下几个类别:价格、供应链、交易、衍生品市场、事件。

- 价格: 文中提到了钢坯和螺纹钢的价格;

- 供应链: 钢坯价格上涨影响到了螺纹钢的期货走势;

- 交易: 文中描述了螺纹钢、热卷和铁矿石的期货交易情况;

- 衍生品市场: 螺纹钢期货的大涨表明了黑色系期货市场的表现;

- 事件: 唐山钢坯连续上涨,带动了黑色系期货的走高。

总结:写prompt需要很有耐心吧...反复尝试,对于中文表达准确程度的提高有很大的帮助。中间服务器无缘无故掉线了一次,程序没保存,直接一晚上白写(间接导致了我文章摆烂),充分让我认识到了保存的重要性以及后台运行的重要性。

Logo

Agent 垂直技术社区,欢迎活跃、内容共建。

更多推荐