matrix-pygmalion-bot/runpod/runpod-worker-transformers/model_fetcher.py

'''
RunPod | Transformer | Model Fetcher
'''

import argparse

import torch
from transformers import (GPTNeoForCausalLM, GPT2Tokenizer, GPTNeoXForCausalLM,
                          GPTNeoXTokenizerFast, GPTJForCausalLM, AutoTokenizer, AutoModelForCausalLM)
from huggingface_hub import snapshot_download

def download_model(model_name):

    # --------------------------------- Neo 1.3B --------------------------------- #
    if model_name == 'gpt-neo-1.3B':
        GPTNeoForCausalLM.from_pretrained("EleutherAI/gpt-neo-1.3B")
        GPT2Tokenizer.from_pretrained("EleutherAI/gpt-neo-1.3B")

    # --------------------------------- Neo 2.7B --------------------------------- #
    elif model_name == 'gpt-neo-2.7B':
        GPTNeoForCausalLM.from_pretrained("EleutherAI/gpt-neo-2.7B", torch_dtype=torch.float16)
        GPT2Tokenizer.from_pretrained("EleutherAI/gpt-neo-2.7B")

    # ----------------------------------- NeoX ----------------------------------- #
    elif model_name == 'gpt-neox-20b':
        GPTNeoXForCausalLM.from_pretrained("EleutherAI/gpt-neox-20b").half()
        GPTNeoXTokenizerFast.from_pretrained("EleutherAI/gpt-neox-20b")

    # --------------------------------- Pygmalion -------------------------------- #
    elif model_name == 'pygmalion-6b':
#        AutoModelForCausalLM.from_pretrained("PygmalionAI/pygmalion-6b", load_in_8bit=True)
#        AutoTokenizer.from_pretrained("PygmalionAI/pygmalion-6b")
        snapshot_download(repo_id="PygmalionAI/pygmalion-6b", revision="main")

    # ----------------------------------- GPT-J ----------------------------------- #
    elif model_name == 'gpt-j-6b':
        GPTJForCausalLM.from_pretrained("EleutherAI/gpt-j-6B", revision="float16",
                                        torch_dtype=torch.float16)
        AutoTokenizer.from_pretrained("EleutherAI/gpt-j-6B")

    # ------------------------------ PPO Shygmalion 6B ----------------------------- #
    elif model_name == 'ppo-shygmalion-6b':
        AutoModelForCausalLM.from_pretrained("TehVenom/PPO_Shygmalion-6b", load_in_8bit=True)
        AutoTokenizer.from_pretrained("TehVenom/PPO_Shygmalion-6b")

    # ------------------------------ Dolly Shygmalion 6B ----------------------------- #
    elif model_name == 'dolly-shygmalion-6b':
        AutoModelForCausalLM.from_pretrained("TehVenom/Dolly_Shygmalion-6b", load_in_8bit=True)
        AutoTokenizer.from_pretrained("TehVenom/Dolly_Shygmalion-6b")

    # ------------------------------ Erebus 13B (NSFW) ----------------------------- #
    elif model_name == 'erebus-13b':
        AutoModelForCausalLM.from_pretrained("KoboldAI/OPT-13B-Erebus", load_in_8bit=True)
        AutoTokenizer.from_pretrained("KoboldAI/OPT-13B-Erebus")

    # --------------------------- Alpaca 13B (Quantized) -------------------------- #
    elif model_name == 'gpt4-x-alpaca-13b-native-4bit-128g':
        AutoModelForCausalLM.from_pretrained("anon8231489123/gpt4-x-alpaca-13b-native-4bit-128g")
        AutoTokenizer.from_pretrained("anon8231489123/gpt4-x-alpaca-13b-native-4bit-128g")

    # --------------------------------- Alpaca 13B -------------------------------- #
    elif model_name == 'gpt4-x-alpaca':
        AutoModelForCausalLM.from_pretrained("chavinlo/gpt4-x-alpaca", load_in_8bit=True)
        AutoTokenizer.from_pretrained("chavinlo/gpt4-x-alpaca")


# ---------------------------------------------------------------------------- #
#                                Parse Arguments                               #
# ---------------------------------------------------------------------------- #
parser = argparse.ArgumentParser(description=__doc__)
parser.add_argument("--model_name", type=str,
                    default="gpt-neo-1.3B", help="URL of the model to download.")


if __name__ == "__main__":
    args = parser.parse_args()
    download_model(args.model_name)
work on remote workers 2 years ago			`'''`
			`RunPod \| Transformer \| Model Fetcher`
			`'''`

			`import argparse`

			`import torch`
			`from transformers import (GPTNeoForCausalLM, GPT2Tokenizer, GPTNeoXForCausalLM,`
			`GPTNeoXTokenizerFast, GPTJForCausalLM, AutoTokenizer, AutoModelForCausalLM)`
chatbot remote worker test 2 years ago			`from huggingface_hub import snapshot_download`
work on remote workers 2 years ago
			`def download_model(model_name):`

			`# --------------------------------- Neo 1.3B --------------------------------- #`
			`if model_name == 'gpt-neo-1.3B':`
			`GPTNeoForCausalLM.from_pretrained("EleutherAI/gpt-neo-1.3B")`
			`GPT2Tokenizer.from_pretrained("EleutherAI/gpt-neo-1.3B")`

			`# --------------------------------- Neo 2.7B --------------------------------- #`
			`elif model_name == 'gpt-neo-2.7B':`
			`GPTNeoForCausalLM.from_pretrained("EleutherAI/gpt-neo-2.7B", torch_dtype=torch.float16)`
			`GPT2Tokenizer.from_pretrained("EleutherAI/gpt-neo-2.7B")`

			`# ----------------------------------- NeoX ----------------------------------- #`
			`elif model_name == 'gpt-neox-20b':`
			`GPTNeoXForCausalLM.from_pretrained("EleutherAI/gpt-neox-20b").half()`
			`GPTNeoXTokenizerFast.from_pretrained("EleutherAI/gpt-neox-20b")`

			`# --------------------------------- Pygmalion -------------------------------- #`
			`elif model_name == 'pygmalion-6b':`
chatbot remote worker test 2 years ago			`# AutoModelForCausalLM.from_pretrained("PygmalionAI/pygmalion-6b", load_in_8bit=True)`
			`# AutoTokenizer.from_pretrained("PygmalionAI/pygmalion-6b")`
			`snapshot_download(repo_id="PygmalionAI/pygmalion-6b", revision="main")`
work on remote workers 2 years ago
			`# ----------------------------------- GPT-J ----------------------------------- #`
			`elif model_name == 'gpt-j-6b':`
			`GPTJForCausalLM.from_pretrained("EleutherAI/gpt-j-6B", revision="float16",`
			`torch_dtype=torch.float16)`
			`AutoTokenizer.from_pretrained("EleutherAI/gpt-j-6B")`

			`# ------------------------------ PPO Shygmalion 6B ----------------------------- #`
add experimental and wip worker containers 2 years ago			`elif model_name == 'ppo-shygmalion-6b':`
chatbot remote worker test 2 years ago			`AutoModelForCausalLM.from_pretrained("TehVenom/PPO_Shygmalion-6b", load_in_8bit=True)`
work on remote workers 2 years ago			`AutoTokenizer.from_pretrained("TehVenom/PPO_Shygmalion-6b")`

add experimental and wip worker containers 2 years ago			`# ------------------------------ Dolly Shygmalion 6B ----------------------------- #`
			`elif model_name == 'dolly-shygmalion-6b':`
chatbot remote worker test 2 years ago			`AutoModelForCausalLM.from_pretrained("TehVenom/Dolly_Shygmalion-6b", load_in_8bit=True)`
add experimental and wip worker containers 2 years ago			`AutoTokenizer.from_pretrained("TehVenom/Dolly_Shygmalion-6b")`

work on remote workers 2 years ago			`# ------------------------------ Erebus 13B (NSFW) ----------------------------- #`
			`elif model_name == 'erebus-13b':`
chatbot remote worker test 2 years ago			`AutoModelForCausalLM.from_pretrained("KoboldAI/OPT-13B-Erebus", load_in_8bit=True)`
work on remote workers 2 years ago			`AutoTokenizer.from_pretrained("KoboldAI/OPT-13B-Erebus")`

add experimental and wip worker containers 2 years ago			`# --------------------------- Alpaca 13B (Quantized) -------------------------- #`
			`elif model_name == 'gpt4-x-alpaca-13b-native-4bit-128g':`
			`AutoModelForCausalLM.from_pretrained("anon8231489123/gpt4-x-alpaca-13b-native-4bit-128g")`
			`AutoTokenizer.from_pretrained("anon8231489123/gpt4-x-alpaca-13b-native-4bit-128g")`

			`# --------------------------------- Alpaca 13B -------------------------------- #`
			`elif model_name == 'gpt4-x-alpaca':`
chatbot remote worker test 2 years ago			`AutoModelForCausalLM.from_pretrained("chavinlo/gpt4-x-alpaca", load_in_8bit=True)`
add experimental and wip worker containers 2 years ago			`AutoTokenizer.from_pretrained("chavinlo/gpt4-x-alpaca")`

work on remote workers 2 years ago
			`# ---------------------------------------------------------------------------- #`
			`# Parse Arguments #`
			`# ---------------------------------------------------------------------------- #`
			`parser = argparse.ArgumentParser(description=__doc__)`
			`parser.add_argument("--model_name", type=str,`
			`default="gpt-neo-1.3B", help="URL of the model to download.")`


			`if __name__ == "__main__":`
			`args = parser.parse_args()`
			`download_model(args.model_name)`