Add better docstrings

huggingface · LysandreJik · Aug 31, 2022 · Jul 30, 2022 · Aug 3, 2022 · Aug 3, 2022
commit 2351b452aa0448e2eb01943f912c971a0af59b83
diff --git a/src/transformers/models/layoutlm/modeling_layoutlm.py b/src/transformers/models/layoutlm/modeling_layoutlm.py
@@ -1314,8 +1314,9 @@ def forward(
         >>> end_scores = outputs.end_logits
         >>> start, end = word_ids[start_scores.argmax(-1)], word_ids[end_scores.argmax(-1)]
         >>> print(" ".join(words[start:end+1]))
-        ```
-        """
+        M. Hamann P. Harper, P. Martinez
+
+        ```"""
 
         return_dict = return_dict if return_dict is not None else self.config.use_return_dict
 

diff --git a/src/transformers/models/layoutlm/modeling_tf_layoutlm.py b/src/transformers/models/layoutlm/modeling_tf_layoutlm.py
@@ -963,6 +963,7 @@ def call(
         ... )
 
         >>> last_hidden_states = outputs.last_hidden_state
+
         ```"""
 
         outputs = self.layoutlm(
@@ -1094,6 +1095,7 @@ def call(
         ... )
 
         >>> loss = outputs.loss
+
         ```"""
 
         outputs = self.layoutlm(
@@ -1218,6 +1220,7 @@ def call(
 
         >>> loss = outputs.loss
         >>> logits = outputs.logits
+
         ```"""
 
         outputs = self.layoutlm(
@@ -1347,6 +1350,7 @@ def call(
 
         >>> loss = outputs.loss
         >>> logits = outputs.logits
+
         ```"""
 
         outputs = self.layoutlm(
@@ -1452,8 +1456,8 @@ def call(
         >>> from transformers import AutoTokenizer, TFLayoutLMForQuestionAnswering
         >>> from datasets import load_dataset
 
-        >>> tokenizer = AutoTokenizer.from_pretrained("microsoft/layoutlm-base-uncased")
-        >>> model = TFLayoutLMForQuestionAnswering.from_pretrained("microsoft/layoutlm-base-uncased")
+        >>> tokenizer = AutoTokenizer.from_pretrained("impira/layoutlm-document-qa", add_prefix_space=True)
+        >>> model = TFLayoutLMForQuestionAnswering.from_pretrained("impira/layoutlm-document-qa", from_pt=True)
 
         >>> dataset = load_dataset("nielsr/funsd", split="train")
         >>> example = dataset[0]
@@ -1474,10 +1478,15 @@ def call(
         ...         bbox.append([0] * 4)
         >>> encoding["bbox"] = tf.convert_to_tensor([bbox])
 
+        >>> word_ids = encoding.word_ids(0)
         >>> outputs = model(**encoding)
         >>> loss = outputs.loss
         >>> start_scores = outputs.start_logits
         >>> end_scores = outputs.end_logits
+        >>> start, end = word_ids[tf.math.argmax(start_scores, -1)[0]], word_ids[tf.math.argmax(end_scores, -1)[0]]
+        >>> print(" ".join(words[start:end+1]))
+        M. Hamann P. Harper, P. Martinez
+
         ```"""
 
         outputs = self.layoutlm(