Name		Name	Last commit message	Last commit date
parent directory ..
README.md		README.md
module.py		module.py

README.md

word2vec_skipgram

模型名称	word2vec_skipgram
类别	文本-词嵌入
网络	skip-gram
数据集	百度自建数据集
是否支持Fine-tuning	是
模型大小	861MB
最新更新日期	2021-02-26
数据指标	-

一、模型基本信息

模型介绍
- Word2vec是常用的词嵌入（word embedding）模型。该PaddleHub Module基于Skip-gram模型，在海量百度搜索数据集下预训练得到中文单词预训练词嵌入。其支持Fine-tune。Word2vec的预训练数据集的词汇表大小为1700249，word embedding维度为128。

二、安装

1、环境依赖
- paddlepaddle >= 1.8.2
- paddlehub >= 1.8.0 | 如何安装PaddleHub
2、安装
- ```
$ hub install word2vec_skipgram
```
- 如您安装时遇到问题，可参考：零基础windows安装 | 零基础Linux安装 | 零基础MacOS安装

三、模型API

1、Finetune代码示例

import paddlehub as hub

# Load word2vec pretrained model
module = hub.Module(name="word2vec_skipgram")
inputs, outputs, program = module.context(trainable=True)

# Must feed all the tensor of module need
word_ids = inputs["text"]

# Use the pretrained word embeddings
embedding = outputs["emb"]

2、API
- ```
context(trainable=False, max_seq_len=128, num_slots=1)
```
  - 参数
    - trainable(bool): trainable=True表示program中的参数在Fine-tune时需要微调，否则保持不变。
    - max_seq_len(int): 模型使用的最大序列长度。
    - num_slots(int): 输入到模型所需要的文本个数，如完成单句文本分类任务，则num_slots=1；完成pointwise文本匹配任务，则num_slots=2；完成pairtwise文本匹配任务，则num_slots=3；
  - 返回
    - inputs(dict): program的输入变量
    - outputs(dict): program的输出变量
    - main_program(Program): 带有预训练参数的program

四、更新历史

1.0.0

初始发布
1.1.0

模型升级，支持用于文本分类，文本匹配等各种任务迁移学习

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

word2vec_skipgram

word2vec_skipgram

README.md

word2vec_skipgram

一、模型基本信息

模型介绍

二、安装

1、环境依赖

2、安装

三、模型API

1、Finetune代码示例

2、API

四、更新历史

Files

word2vec_skipgram

Directory actions

More options

Directory actions

More options

Latest commit

History

word2vec_skipgram

Folders and files

parent directory

README.md

word2vec_skipgram

一、模型基本信息

模型介绍

二、安装

1、环境依赖

2、安装

三、模型API

1、Finetune代码示例

2、API

四、更新历史