log_logits_on_p3.py

import os.path
import random
import sys
from transformers import (GPT2Tokenizer, AutoModelForCausalLM,
                          GPTNeoXForCausalLM, AutoTokenizer)
import numpy as np
import torch
from scipy.spatial.distance import jensenshannon
from scipy.stats import entropy
import pandas as pd
from transformers import LogitsWarper, LogitsProcessorList
from transformers.generation import LogitNormalization
from scipy.spatial.distance import cosine
import torch.nn.functional as F
import glob
import json
import re
from torch import nn
from tqdm.auto import tqdm


def get_top_p_tokens(ps, p=.9):
    sorted_probs, sorted_tokens = torch.topk(ps, k=len(ps))
    cumprobs = torch.cumsum(sorted_probs, dim=0)
    top_p = cumprobs[cumprobs < p].shape[0]
    top_p = max(top_p, 1)
    return sorted_tokens[:top_p].cpu().detach().numpy(), sorted_probs[:top_p].cpu().detach().numpy()


class CFGModelForCausalLM(nn.Module):
    """Stub of a Model Class that produces the likelihood of a prompt + continuation under a set CFG value."""

    def __init__(self, hf_causal_model=None, model_family=None, instruction_tuned_model=None, cfg=None, round_to=4):
        super().__init__()
        self.hf_causal_model = hf_causal_model
        self.instruction_tuned_model = instruction_tuned_model
        self.cfg = cfg
        self.round_to = round_to
        self.model_family = model_family
        self.output_logits = False

    def tensor_to_list(self, torch_arr):
        l = torch_arr.squeeze().cpu().cpu().detach().numpy().tolist()
        return list(map(lambda x: round(x, self.round_to), l))

    def model_forward(self, input_ids, model, use_cache=False, past_key_values=None):
        if self.model_family == 't5':
            return model(input_ids=input_ids, decoder_input_ids=input_ids, use_cache=use_cache, past_key_values=past_key_values)
        else:
            return model(input_ids=input_ids, use_cache=use_cache, past_key_values=past_key_values)

    def forward(
            self,
            cfg_long_seq,
            cfg_short_seq,
            use_cache=False,
            past_key_values_long=None,
            past_key_values_short=None,
            past_key_values_instruction_tuned=None,
    ):
        """Generic `forward` method for calculating the logits of a sequence using CFG sequence."""
        logits_cfg = logits_long = logits_short = None
        if self.hf_causal_model is not None:
            logits_long = self.model_forward(
                model=self.hf_causal_model,
                input_ids=cfg_long_seq,
                use_cache=use_cache,
                past_key_values=past_key_values_long
            )
            logits_short = self.model_forward(
                model=self.hf_causal_model,
                input_ids=cfg_short_seq,
                use_cache=use_cache,
                past_key_values=past_key_values_short
            )

            l = F.log_softmax(logits_long[0][:, -1:], dim=-1)
            s = F.log_softmax(logits_short[0][:, -1:], dim=-1)
            logits_cfg = self.cfg * (l - s) + s

        logits_instruct = None
        if self.instruction_tuned_model is not None:
            # swap devices if necessary
            if self.instruction_tuned_model.device != self.hf_causal_model.device:
                cfg_long_seq = cfg_long_seq.to(self.instruction_tuned_model.device)

            logits_instruct = self.model_forward(
                model=self.instruction_tuned_model,
                input_ids=cfg_long_seq,
                use_cache=use_cache,
                past_key_values=past_key_values_instruction_tuned
            )

        return (
            logits_cfg, logits_long, logits_short, logits_instruct
        )

    def get_single_metrics(self, tok, logits, prob_name, output, calcs):
        prob = torch.softmax(logits.squeeze(), dim=0)
        top_p_toks, top_p_probs = get_top_p_tokens(prob, p=.9)
        token_ranks = torch.argsort(prob, descending=True).argsort().cpu().detach().numpy()

        output[f'prob_{prob_name}(token)'] = float(prob[tok])
        output[f'rank_{prob_name}(token)'] = int(token_ranks[tok])
        calcs[f'top_k_toks_{prob_name}'] = torch.topk(prob, k=10_000).indices.cpu().detach().numpy()

        prob = prob.cpu().detach().numpy()
        output[f'entropy_{prob_name}'] = float(entropy(prob))
        output[f'num_top_p_toks_{prob_name}'] = len(top_p_toks)
        calcs[f'prob_{prob_name}'] = prob
        calcs[f'token_ranks_{prob_name}'] = token_ranks
        calcs[f'top_p_toks_{prob_name}'] = top_p_toks
        return output, calcs

    def get_comparison_metrics(self, tok, calcs, prob_1_name, prob_2_name, output):
        prob_1, prob_2 = calcs[f'prob_{prob_1_name}'], calcs[f'prob_{prob_2_name}']
        ranks_1, ranks_2 = calcs[f'token_ranks_{prob_1_name}'], calcs[f'token_ranks_{prob_2_name}']
        top_p_toks_1, top_p_toks_2 = set(calcs[f'top_p_toks_{prob_1_name}']), set(calcs[f'top_p_toks_{prob_2_name}'])
        top_k_toks_1, top_k_toks_2 = calcs[f'top_k_toks_{prob_1_name}'], calcs[f'top_k_toks_{prob_2_name}']

        # token-level differences
        output[f'prob_{prob_1_name}(token) - prob_{prob_2_name}(token)'] = float(prob_1[tok] - prob_2[tok])
        output[f'rank_{prob_1_name}(token) - rank_{prob_2_name}(token)'] = int(ranks_1[tok] - ranks_2[tok])
        output[f'clamped_rank_{prob_1_name}(token) - rank_{prob_2_name}(token)'] = int(
            min(ranks_1[tok], 50) - min(ranks_2[tok], 50)
        )

        # distribution-level differences
        if len(prob_1) != len(prob_2):
            sel_toks = top_k_toks_1 if len(prob_1) < len(prob_2) else top_k_toks_2
            prob_1, prob_2 = prob_1[sel_toks], prob_2[sel_toks]

        output[f'JSD(prob_{prob_1_name} || prob_{prob_2_name})'] = float(jensenshannon(prob_1, prob_2))
        output[f'top p token overlap({prob_1_name} || {prob_2_name})'] = (
                len(top_p_toks_1 & top_p_toks_2) / len(top_p_toks_1 | top_p_toks_2)
        )
        output[f'top k token overlap({prob_1_name} || {prob_2_name})'] = (
                len(set(top_k_toks_1[:10]) & set(top_k_toks_2[:10])) / len(set(top_k_toks_1[:10]) | set(top_k_toks_2[:10]))
        )
        output[f'l2 distance(prob_{prob_1_name} || prob_{prob_2_name})'] = float(np.linalg.norm(prob_1 - prob_2))
        output[f'cosine distance(prob_{prob_1_name} || prob_{prob_2_name})'] = float(cosine(prob_1, prob_2))
        return output

    def gather_logits(
            self, prompt_ids, continuation_ids, use_cache=False, output_file=None,
            len_cutoff=None,
            *args, **kwargs
    ):
        """Iterates returns the sequence-level perplexity of a `continuation` given a `prompt` using CFG.
        Important: Excludes the first token from the perplexity calculation.
        """
        unprompted_kv_cache, prompted_kv_cache, instruct_kv_cache = None, None, None
        running_prompt_tokens = prompt_ids
        running_unprompted_tokens = prompt_ids[:, -1:]
        for i, target_tok in enumerate(continuation_ids[0]):
            if i + len(prompt_ids[0]) >= len_cutoff:
                break

            if running_prompt_tokens.shape[1] == 0:
                continue

            logits_cfg, logits_long, logits_short, logits_instruct = self.forward(
                running_prompt_tokens,
                running_unprompted_tokens,
                use_cache=use_cache,
                past_key_values_long=prompted_kv_cache,
                past_key_values_short=unprompted_kv_cache,
                past_key_values_instruction_tuned=instruct_kv_cache,
            )

            if output_file is not None:
                with open(output_file, 'a') as f:
                    output_packet, calcs = {}, {}
                    output_packet['token'] = int(target_tok)
                    output_packet['continuation word idx'] = i
                    output_packet['overall word idx'] = i + len(prompt_ids[0])
                    output_packet['prompt length'] = len(prompt_ids[0])
                    output_packet['continuation length'] = len(continuation_ids[0])
                    if self.hf_causal_model is not None:
                        self.get_single_metrics(target_tok, logits_long[0][:, -1:], 'prompted', output_packet, calcs)
                        self.get_single_metrics(target_tok, logits_short[0][:, -1:], 'unprompted', output_packet, calcs)
                        self.get_single_metrics(target_tok, logits_cfg, 'cfg', output_packet, calcs)
                        self.get_comparison_metrics(target_tok, calcs, 'prompted', 'unprompted', output_packet)
                        self.get_comparison_metrics(target_tok, calcs, 'cfg', 'prompted', output_packet)
                        self.get_comparison_metrics(target_tok, calcs, 'cfg', 'unprompted', output_packet)
                        if self.output_logits:
                            output_packet['cfg_logits'] = self.tensor_to_list(logits_cfg)
                            output_packet['prompted_logits'] = self.tensor_to_list(logits_long[0][:, -1:])
                            output_packet['unprompted_logits'] = self.tensor_to_list(logits_short[0][:, -1:])
                    if self.instruction_tuned_model is not None:
                        if self.output_logits:
                            output_packet['instruction_model_logits'] = self.arr_to_list(logits_instruct[0][:, -1:])
                    if (self.hf_causal_model is not None) and (self.instruction_tuned_model is not None):
                        self.get_single_metrics(target_tok, logits_instruct[0][:, -1:], 'instruction_model', output_packet, calcs)
                        self.get_comparison_metrics(target_tok, calcs, 'prompted', 'instruction_model', output_packet)
                        self.get_comparison_metrics(target_tok, calcs, 'unprompted', 'instruction_model', output_packet)
                        self.get_comparison_metrics(target_tok, calcs, 'cfg', 'instruction_model', output_packet)

                    f.write(json.dumps(output_packet) + '\n')

            # update tokens
            if use_cache:
                running_prompt_tokens = continuation_ids[:, i:i+1]
                running_unprompted_tokens = continuation_ids[:, i:i+1]
                if logits_long is not None:
                    prompted_kv_cache = logits_long.past_key_values
                    unprompted_kv_cache = logits_short.past_key_values
                if logits_instruct is not None:
                    instruct_kv_cache = logits_instruct.past_key_values
            else:
                running_prompt_tokens = torch.cat([running_prompt_tokens, continuation_ids[:, i:i+1]], dim=-1)
                running_unprompted_tokens = torch.cat([running_unprompted_tokens, continuation_ids[:, i:i+1]], dim=-1)

        return None


def load_model(model_name, revision, device):
    if ('t5' in model_name) or ('T0' in model_name):
        from transformers import T5Tokenizer, T5ForConditionalGeneration
        tokenizer = T5Tokenizer.from_pretrained(model_name)
        model = T5ForConditionalGeneration.from_pretrained(model_name).to(device).eval()
    else:
        tokenizer = AutoTokenizer.from_pretrained(model_name, trust_remote_code=True)
        model = AutoModelForCausalLM.from_pretrained(model_name, revision=revision, trust_remote_code=True).to(device).eval()
    return tokenizer, model


if __name__ == '__main__':
    import argparse
    parser = argparse.ArgumentParser()
    parser.add_argument('--cfg', type=float, default=1.5)
    parser.add_argument('--seed', type=int, default=0)
    parser.add_argument('--model', type=str, default=None)
    parser.add_argument(
        '--instruction-model', type=str, default=None,
        help='Secondary model to run against during generation for comparison.'
    )
    parser.add_argument('--dataset', type=str)
    parser.add_argument('--output-dir', type=str, default='outputs')
    parser.add_argument('--revision', type=str, default=None)
    parser.add_argument('--dont-use-instruction', action='store_true')
    parser.add_argument('--device', type=str, default=None)
    parser.add_argument('--device-2', type=str, default=None)
    parser.add_argument('--max-cont-len', type=int, default=150)
    parser.add_argument('--max-overall-len', type=int, default=275)
    args = parser.parse_args()
    if args.device is None:
        args.device = 'cuda' if torch.cuda.is_available() else 'cpu'
    if args.device_2 is None:
        args.device_2 = 'cuda' if torch.cuda.is_available() else 'cpu'

    if args.model is not None:
        output_model_name = args.model.replace('/', '-').lower()
    else:
        output_model_name = args.instruction_model.replace('/', '-').lower()

    print('loading base model...')
    base_model = None
    if args.model is not None:
        tokenizer, base_model = load_model(args.model, args.revision, args.device)

    instruction_model = None
    if args.instruction_model is not None:
        print('loading instruction model...')
        tokenizer, instruction_model = load_model(args.instruction_model, args.revision, args.device_2)

    model = CFGModelForCausalLM(
        hf_causal_model=base_model,
        cfg=args.cfg,
        instruction_tuned_model=instruction_model,
        model_family='t5' if 't5' in args.model else 'decoder',
    )
    if not os.path.exists(f'{args.output_dir}/{output_model_name}'):
        os.makedirs(f'{args.output_dir}/{output_model_name}')

    print('loading dataset...')
    dataset = pd.read_csv(args.dataset, index_col=0)
    existing_files = glob.glob(f'{args.output_dir}/{output_model_name}/logit-files__*.txt')
    existing_ids = set(map(lambda x: int(re.search('logit-files__.*__(\d+).txt', x).group(1)), existing_files))

    to_remove = "You're an open sourced alternative to ChatGPT. The following is a question, a task, or a conversation; write a response:"
    if 'dataset_name' not in dataset.columns:
        dataset['dataset_name'] = ''
        
    for idx, (dataset, prompt, continuation) in tqdm(
            dataset[['dataset_name', 'inputs_pretokenized', 'targets_pretokenized']].sample(frac=1).iterrows(),
            total=len(dataset)
    ):
        if idx in existing_ids:
            continue

        if to_remove in prompt:
            prompt = prompt.replace(to_remove, '')

        # if there's another process that yielded more ids
        existing_files = glob.glob(f'{args.output_dir}/{output_model_name}/logit-files__*.txt')
        if len(existing_files) != len(existing_ids):
            existing_ids = set(map(lambda x: int(re.search('logit-files__.*__(\d+).txt', x).group(1)), existing_files))

        output_file = f'{args.output_dir}/{output_model_name}/logit-files__{dataset}__{idx}.txt'

        if not args.dont_use_instruction:
            prompt = ("### Instruction: The prompt below is a question to answer, "
                      "a task to complete, or a conversation to respond to; decide "
                      "which and write an appropriate response.\n"
                      f"### Prompt: {prompt}\n### Response:")

        prompt_tokens = tokenizer([prompt], return_tensors="pt")
        cont_tokens = tokenizer([continuation], return_tensors="pt")
        cont_tokens['input_ids'] = cont_tokens['input_ids'][:, :(args.max_cont_len - prompt_tokens['input_ids'].shape[-1])]
        with open(output_file, 'a') as f:
            output_header = {}
            output_header['prompt'] = prompt
            if args.model is not None:
                output_header['model'] = args.model.replace('/', '-').lower()
            if args.instruction_model is not None:
                output_header['instruction-model'] = args.instruction_model.replace('/', '-').lower()
            f.write(json.dumps(output_header) + '\n')

        model.gather_logits(
            prompt_ids=prompt_tokens['input_ids'].to(args.device),
            continuation_ids=cont_tokens['input_ids'].to(args.device),
            use_cache=True,
            len_cutoff=args.max_overall_len,
            output_file=output_file,
        )


# python log_logits_on_p3.py --cfg 1.5 --instruction-model  allenai/tulu-7b --model huggyllama/llama-7b --dont-use-instruction --dataset dataset_to_generate_on.csv --output-dir p3-output-dir/ --device cuda:2 --device-2 cuda:3
# python log_logits_on_p3.py --cfg 1.5 --instruction-model bigscience/T0pp --model t5-11b --dont-use-instruction --dataset dataset_to_generate_on.csv --output-dir p3-output-dir/ --device cuda:4 --device-2 cuda:5


# python log_logits_on_p3.py --cfg 1.1 --instruction-model tiiuae/falcon-7b-instruct --model tiiuae/falcon-7b --dont-use-instruction --dataset qa_big_dataset_to_generate_on.csv --output-dir p3-qa-metrics-output-dir-1.1-cfg/ --device cuda:4 --device-2 cuda:5

# python log_logits_on_p3.py --cfg 1.1 --instruction-model databricks/dolly-v2-12b --model EleutherAI/pythia-12b --dont-use-instruction --dataset qa_big_dataset_to_generate_on.csv --output-dir p3-qa-metrics-output-dir-1.1-cfg/ --device cuda:6 --device-2 cuda:7