写了一个从港交所网站下载招股书并且存入指定文件夹的脚步


import requests
import json
import pandas as pd
import os开始日期 = input('请输入开始日期(例如:2021-08):')  # 搜集当月的信息,如果需要全部文件,就删了
目录 = 'C:/Users/Haru H Shen/Python/HKEX/Post/' + 开始日期if not os.path.exists(目录):os.mkdir(目录)def get_list(路径):response = requests.get(路径).textdic = json.loads(response)a = dic['app']日期 = []名字 = []链接 = []ID = []for i in range(len(a)):date = a[i]['d'].split('/')[2] + '-' + a[i]['d'].split('/')[1] + '-' + a[i]['d'].split('/')[0]name = dic['app'][i]['a']link = 'https://www1.hkexnews.hk/app/'+ dic['app'][i]['ls'][0]['u1']id = dic['app'][i]['id']日期.append(date)名字.append(name)链接.append(link)ID.append(id)# print(日期)# print(名字)# print(链接)return(pd.DataFrame({'日期': 日期, 'ID': ID,'名字': 名字, 'Link': 链接}))Url = 'https://www1.hkexnews.hk/ncms/json/eds/appactive_appphip_sehk_c.json?_=1628605833057'  # json
CN = get_list(Url)Url2 = 'https://www1.hkexnews.hk/ncms/json/eds/appactive_appphip_sehk_e.json?_=1628606534735'
EN = get_list(Url2)result = pd.merge(CN, EN, on='ID', suffixes=['_CN', '_EN'])result.drop(labels = '日期_EN',axis = 1,inplace = True)result['date'] = pd.to_datetime(result['日期_CN'])
result.set_index('date', inplace=True)
Hearing = result.sort_values('date')Hearing2 = Hearing.truncate(before=开始日期)Hearing2.to_csv(目录 + '/HK_Post_Hearing_List.csv',encoding='utf_8_sig')"""
下一步: 下载招股书
"""list = 目录 + '/HK_Post_Hearing_List.csv'
df = pd.read_csv(list, parse_dates=[1])for i in range(len(df)):    # 186怎么来的,有没有更自动的方式,直接返回表格多少行?路径CN = df.iloc[i, 3] + ' CN.pdf'文件CN = requests.get(df.iloc[i, 4]).contentwith open(目录 + '/' + 路径CN, 'wb') as f:  # 要增加/,创建文件夹f.write(文件CN)print(str(i) + df.iloc[i, 3] + '  中文下载完成')路径EN = df.iloc[i, 5] + ' EN.pdf'文件EN = requests.get(df.iloc[i, 6]).contentwith open(目录 +  '/' + 路径EN, 'wb') as f:f.write(文件EN)print(str(i) + df.iloc[i, 5] + '  英文下载完成')'''下载指定link中得文件,从港交所网站下载聆讯后招股书'''

从港交所网站下载聆讯后招股书相关推荐

  1. 有望成为“美容院第一股”美丽田园通过港交所上市ipo聆讯

    有望 成为"美容院第一股" 美丽田园通过港交所上市 ipo聆讯 近日,美丽田园医疗健康产业有限公司(下称"美丽田园")已通过港交所上市IPO聆讯,有望成为&qu ...

  2. 联易融科技在港交所上市:腾讯、红杉等加持,金融业务逾期率翻倍

    4月9日,联易融科技集团(HK:09959,Linklogis Inc,下称"联易融"或"联易融科技")在港交所上市,发行价为17.58港元,计划全球发售452 ...

  3. 康沣生物通过港交所聆讯:持续亏损、现金流紧张,李克俭为董事长

    12月7日,康沣生物科技(上海)股份有限公司(下称"康沣生物")通过港交所上市聆讯,并披露了聆讯后招股书.据贝多财经了解,康沣生物曾先曾于2022年1月12日在港交所递表,后在6个 ...

  4. 乐普生物通过港交所聆讯:在研4种核心产品,平安等为股东

    2月3日,港交所披露易信息显示,乐普生物科技股份有限公司(下称"乐普生物")通过聆讯,并披露了聆讯后招股书.这意味着,乐普生物的IPO进程取得有效成果,有望在近期开启招股并上市. ...

  5. 百果园通过港交所上市聆讯:八成营收来自加盟店,余惠勇为董事长

    撰稿|汤汤 来源|贝多财经 近日,深圳百果园实业(集团)股份有限公司(下称"百果园")通过港交所上市聆讯,并披露了聆讯后招股书. 根据招股书介绍,百果园是中国最大的水果零售经营商. ...

  6. 子不语通过上市聆讯:预计全年净利润同比下滑,华丙如为董事长

    近日,跨境电商企业子不语集团有限公司(下称"子不语")通过港交所上市聆讯,并披露了聆讯后招股书.据贝多财经了解,子不语更新了截至2022年6月30日的财务数据等信息,最后实际可行日 ...

  7. 港交所新股发售竞争激烈:网易云音乐暗盘破发,凯莱英、顺丰同城等暂未获得足额申购

    近日,港交所新股市场热闹非常.就在2021年11月30日,包括凯莱英.顺丰同城.康耐特光学等在内的6家公司正式开启招股,同期正处于招股状态的还有微博-W(HK:09898)等. 在此之前,网易云音乐( ...

  8. 读书郎通过上市聆讯:平板业务毛利率走低,2021年利润同比下滑11%

    近日,读书郎教育控股有限公司(下称"读书郎教育"或"读书郎")通过港交所聆讯并于6月22日更新了聆讯后招股书(聆讯后资料集).这意味着,读书郎的上市进程取得有效 ...

  9. 玄武云科技通过上市聆讯:业绩波动明显,陈永辉等三人为控股股东

    2022年6月12日,玄武云科技控股有限公司(下称"玄武云"或"玄武云科技")通过聆讯,并披露聆讯后招股书.招股书显示,玄武云科技补充披露了截至2022年6月1 ...

最新文章

  1. VirtualBox下安装RHEL5.5+Oracle 11g手记
  2. CentOS7配置防火墙
  3. System.arraycopy
  4. 2016/3/16 高级查询 ①连接查询 ②联合查询 ③子查询 无关 相关
  5. UILabel(富文本)
  6. Java中哪些可以作为GC Roots
  7. 想要学习C++,到底能从事哪种行业?
  8. redis 验证消息队列也是写磁盘的
  9. 官方个人免签系统网站源码柒上支付聚合三方四方支付系统
  10. autojs刷网课之一、刷视频篇
  11. handlersocket php,mac编译安装php的handlersocket扩展
  12. Hive常用命令之MSCK REPAIR TABLE命令概述
  13. 从薛定谔方程到K-S方程
  14. AOP之基于AspectJ注解总结与案例
  15. Part-02/通过案例学爬虫(豆瓣电影TOP250)
  16. 抖音新号怎么快速涨粉(8种抖音运营吸粉技巧)
  17. 【C++·C11】C++ 时间与时间戳
  18. win7注册表关闭防火墙服务器,怎么样修改注册表来关闭windows防火墙?
  19. linux与python客户端,Python编写的socket服务器和客户端
  20. java借助Robot给微信好友自动发消息(可发送表情包)

热门文章

  1. 网御星云WAF的配置页面与浏览器兼容性问题
  2. 鼠标连点器,怎么玩转鼠标自动点击?
  3. 什么样的蜂蜜好_陕南赤子_新浪博客
  4. 微前端vue项目实战 -- 乾坤qiankun框架 (一)
  5. 使用ffmpeg将无损APE或FLAC转换为苹果的无损格式
  6. 场景生成及编辑3D定位论文阅读
  7. LoRa数字语音模块—全双工,多方通话,预留优先位
  8. 基于嵌入式ARM核心板的荧光免疫分析仪方案
  9. android 7.0 兼容多语言切换总结
  10. 【二】MATLAB矩阵处理