Siamese-nn-semantic-text-similarity - A repository containing comprehensive Neural Networks based PyTorch implementations for the semantic text similarity task

Last update: Dec 15, 2022

Overview

Siamese Deep Neural Networks for Semantic Text Similarity PyTorch

A repository containing comprehensive Neural Networks based PyTorch implementations for the semantic text similarity task, including architectures such as:

Siamese LSTM
Siamese BiLSTM with Attention
Siamese Transformer
Siamese BERT.

Usage

install dependencies

pip install -r requirements.txt

download spacy en model for tokenization

python -m spacy download en

Siamese LSTM

Siamese LSTM Example

 ## init siamese lstm
    siamese_lstm = SiameseLSTM(
        batch_size=batch_size,
        output_size=output_size,
        hidden_size=hidden_size,
        vocab_size=vocab_size,
        embedding_size=embedding_size,
        embedding_weights=embedding_weights,
        lstm_layers=lstm_layers,
        device=device,
    )

    ## define optimizer
    optimizer = torch.optim.Adam(params=siamese_lstm.parameters())
   
   ## train model
    train_model(
        model=siamese_lstm,
        optimizer=optimizer,
        dataloader=sick_dataloaders,
        data=sick_data,
        max_epochs=max_epochs,
        config_dict={"device": device, "model_name": "siamese_lstm"},
    )

Siamese BiLSTM with Attention

Siamese BiLSTM with Attention Example

     ## init siamese lstm
     siamese_lstm_attention = SiameseBiLSTMAttention(
        batch_size=batch_size,
        output_size=output_size,
        hidden_size=hidden_size,
        vocab_size=vocab_size,
        embedding_size=embedding_size,
        embedding_weights=embedding_weights,
        lstm_layers=lstm_layers,
        self_attention_config=self_attention_config,
        fc_hidden_size=fc_hidden_size,
        device=device,
        bidirectional=bidirectional,
    )
    
    ## define optimizer
    optimizer = torch.optim.Adam(params=siamese_lstm_attention.parameters())
   
   ## train model
    train_model(
        model=siamese_lstm_attention,
        optimizer=optimizer,
        dataloader=sick_dataloaders,
        data=sick_data,
        max_epochs=max_epochs,
        config_dict={
            "device": device,
            "model_name": "siamese_lstm_attention",
            "self_attention_config": self_attention_config,
        },
    )

Siamese Transformer

Siamese Transformer Example

    ## init siamese bilstm with attention
    siamese_transformer = SiameseTransformer(
        batch_size=batch_size,
        vocab_size=vocab_size,
        embedding_size=embedding_size,
        nhead=attention_heads,
        hidden_size=hidden_size,
        transformer_layers=transformer_layers,
        embedding_weights=embedding_weights,
        device=device,
        dropout=dropout,
        max_sequence_len=max_sequence_len,
    )

    ## define optimizer
    optimizer = torch.optim.Adam(params=siamese_transformer.parameters())
   
   ## train model
    train_model(
        model=siamese_transformer,
        optimizer=optimizer,
        dataloader=sick_dataloaders,
        data=sick_data,
        max_epochs=max_epochs,
        config_dict={"device": device, "model_name": "siamese_transformer"},
    )

Siamese BERT

Siamese BERT Example

    from siamese_sts.siamese_net.siamese_bert import BertForSequenceClassification
    ## init siamese bert
    siamese_bert = BertForSequenceClassification.from_pretrained(model_name)

    ## train model
    trainer = transformers.Trainer(
        model=siamese_bert,
        args=transformers.TrainingArguments(
            output_dir="./output",
            overwrite_output_dir=True,
            learning_rate=1e-5,
            do_train=True,
            num_train_epochs=num_epochs,
            # Adjust batch size if this doesn't fit on the Colab GPU
            per_device_train_batch_size=batch_size,
            save_steps=3000,
        ),
        train_dataset=sick_dataloader,
    )
    trainer.train()

Siamese-nn-semantic-text-similarity - A repository containing comprehensive Neural Networks based PyTorch implementations for the semantic text similarity task

Related tags

Overview

Siamese Deep Neural Networks for Semantic Text Similarity PyTorch

Usage

Siamese LSTM

Siamese BiLSTM with Attention

Siamese Transformer

Siamese BERT

Owner

Shahrukh Khan

Joint Discriminative and Generative Learning for Person Re-identification. CVPR'19 (Oral)

DEMix Layers for Modular Language Modeling

Multimodal Descriptions of Social Concepts: Automatic Modeling and Detection of (Highly Abstract) Social Concepts evoked by Art Images

FaRL for Facial Representation Learning

Official Implementation of CoSMo: Content-Style Modulation for Image Retrieval with Text Feedback

A repository for benchmarking neural vocoders by their quality and speed.

Yolov5 + Deep Sort with PyTorch

PyTorch implementation of "Representing Shape Collections with Alignment-Aware Linear Models" paper.

Open Source Differentiable Computer Vision Library for PyTorch

Object detection and instance segmentation toolkit based on PaddlePaddle.

Code of paper "Compositionally Generalizable 3D Structure Prediction"

Automatic Video Captioning Evaluation Metric --- EMScore

An open source Jetson Nano baseboard and tools to design your own.

ADGAN - The Implementation of paper Controllable Person Image Synthesis with Attribute-Decomposed GAN

Implementation of Segnet, FCN, UNet , PSPNet and other models in Keras.

1st ranked 'driver careless behavior detection' for AI Online Competition 2021, hosted by MSIT Korea.

Self-labelling via simultaneous clustering and representation learning. (ICLR 2020)

Shuwa Gesture Toolkit is a framework that detects and classifies arbitrary gestures in short videos

An OpenAI Gym environment for multi-agent car racing based on Gym's original car racing environment.

Selecting Parallel In-domain Sentences for Neural Machine Translation Using Monolingual Texts