Giter VIP home page Giter VIP logo

financechatglm's Introduction

SMP 2023 ChatGLM 金融大模型挑战赛 60 分 Baseline 思路

队伍: 小打小闹

数据提取整体过程

数据提取整体过程

PDF 表格识别结果对比

识别结果1 识别结果2

自研PDF表格识别逻辑

逻辑1 逻辑2 逻辑3

主要步骤:

  1. 定位表格区域
  2. 识别单元格
  3. 跨页表格合并

识别单元格并生成表格算法伪代码

伪代码1 伪代码2

基于有限状态机的数据提取

有限状态机

资产负债表示意图 (三大表之一) 数据入库

数据入库

主要内容:

  • 公司基本信息
  • 资产负债表
  • 现金流量表
  • 利润表
  • 公司员工信息

公司全称与简称及代码对照

对照表

信息从表格转为文本描述

公司员工信息

员工信息

文本描述示例: 安靠智电

安靠智电(股票代码:300617)在2019年共有642名职工,其中74人是研发人员,研发人员占比11.53%。该公司有10名硕士学历以上学历的员工,但没有博士学历的员工。

整体推理流程

推理流程

⚠️ 不要相信大模型的数学能力

改进前

改进前

改进后

直接帮他算好。

安记食品2019年营业利润为49072627.15元, 2019年营业收入为421296738.60元。根据公式:

[ \text{营业利润率} = \frac{\text{营业利润}}{\text{营业收入}} \times 100 ]

得出结果安记食品2019年营业利润率为11.65%。

⚠️ 不要相信大模型的推理能力

建议 剔除冗余信息,否则可能无法得到正确答案。

推理示例 """

financechatglm's People

Contributors

ethanhwang1024 avatar ronaldjen avatar

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.