张士玉小黑屋

一个关注IT技术分享，关注互联网的网站，爱分享网络资源，分享学到的知识，分享生活的乐趣。

当前位置：首页 » 《随便一记》 » 正文

天池大模型逻辑推理入门

21 人参与 2024年10月06日 17:20 分类 : 《随便一记》评论

点击全文阅读

参考数据鲸 (linklearner.com)

1. 跑通baseline

报名

申领大模型API

模型服务灵积-API-KEY管理 (aliyun.com)

跑通代码

在anaconda新建名为“LLM”的环境，并安装好相应包后，在jupyter notebook上运行baseline01.ipynb

2. 赛题解读

一般情况下，拿到一个赛题之后，我们需要明确：

1）这是一个什么场景下的赛题；

2）这个赛题要解决什么问题。

本次学习活动的赛题“复杂推理能力评估”是一个大语言模型处理推理任务的问题

数据集为逻辑推理数据，其中训练集中包含500条训练数据，测试集中包含500条测试数据。每个问题包括若干子问题，每个子问题为单项选择题，选项不定（最多5个）。目标是为每个子问题选择一个正确答案。推理答案基于闭世界假设（closed-world assumption），即未观测事实或者无法推断的事实为假。

具体的，每条训练数据包含 content, questions字段，其中content是题干，questions为具体的子问题。questions是一个子问题列表，每个子问题包括options和answer字段，其中options是一个列表，包含具体的选项，按照ABCDE顺序排列，answer是标准答案。

数据集格式如下:

round1_train_data.jsonl : 每一行代表一条反应

测试集 round1_test_data.jsonl 不包含answer字段。

赛题背景

该比赛聚焦于通过解决复杂的逻辑推理题，测试大型语言模型的逻辑推理能力。

这些逻辑题涵盖了多种关系和推理规则，能够全面评估模型的逻辑推理能力。赛题设置上，采用了多样化的逻辑题，覆盖了不同难度的逻辑推理任务，强调了逻辑推理在AI领域的重要性。

比赛的研究成果将有助于评估和改进模型的逻辑推理能力。这对于开发更智能、更有效的人工智能系统具有重要意义。同时，大赛希望提供机会给选手学习和应用逻辑推理与自然语言处理的知识，培养跨学科的研究人才。

比赛任务

本次比赛提供基于自然语言的逻辑推理问题，涉及多样的场景，包括关系预测、数值计算、谜题等，期待选手通过分析推理数据，利用机器学习、深度学习算法或者大语言模型，建立预测模型。

点击全文阅读

本文链接：http://m.zhangshiyu.com/post/168352.html

评论（0）

赞助本站

search zhannei

最新文章
晚风未及你眼底虞照晚周砚完本_晚风未及你眼底（虞照晚周砚）

送你一封诀别书

替嫁三年，冷脸大佬他藏不住了

分到烂尾楼后，我成全员白月光

星河月影两不移

失忆后，前夫成了我的猎物

宣彤王冶王先生又争又抢还撬

言丹姝乔知行全文给白月光磕了六年头，该你求我了全书免费在线

手撕顶流爹地后，玄学小奶团带妈咪另嫁豪门在线-顾星棠沈念免费

顾佳思霍铮南时夏i全

给白月光磕了六年头，该你求我了全书畅读

秦枫秦昊***角的全文

关于我们 | 我要投稿 | 免责申明

张士玉小黑屋

当前位置：首页 » 《随便一记》 » 正文

天池 大模型逻辑推理 入门

21 人参与 2024年10月06日 17:20 分类 : 《随便一记》 评论