$ tree . . |-- bert_cloud_tpu.md |-- classifier_data_lib.py # 分类数据方法库 |-- common_flags.py # 通用命令行参数 |-- create_finetuning_data.py # 生成tfrecord格式的微调数据(依赖classifier_data_lib.py) |-- create_pretraining_data.py # 生成预训练数据(只有重新预训练整个模型时才使用,本次不用) |-- custom_metrics.py # 自定义文件,用于计算自定义metrics |-- do_pred_data.py # 自定义文件,用于生成预测数据 |-- do_predict.py # 自定义文件,用于模型训练完成后执行预测 |-- export_tfhub.py |-- export_tfhub_test.py |-- __init__.py |-- input_pipeline.py # 用于加载tfrecord格式的训练数据 |-- model_saving_utils.py # 用于模型保存 |-- README.md |-- run_classifier.py # finetune分类主程序 |-- run_pretraining.py # 预训练主程序(本次不用) |-- run_squad.py # squad主程序(本次不用) |-- squad_lib.py |-- squad_lib_sp.py |-- tf1_checkpoint_converter_lib.py |-- tf2_albert_encoder_checkpoint_converter.py |-- tf2_encoder_checkpoint_converter.py |-- tokenization.py # 分词器 |-- tokenization_test.py `-- utils.py #自定义文件,用于绘制自定义metrics图表 0 directories, 25 files
和官网的目录文件多一点,参考https://www.cnblogs.com/zhongmiaozhimen/p/12228839.html
1
ModuleNotFoundError: No module named ‘bert.tokenization‘
!pip install bert-tensorflow
2
3
4
5
原文:https://www.cnblogs.com/xingnie/p/12781442.html